杜谋⁠斯

和国内的同行又聊了几句 ChatGPT 的事情大致得出了以下结论国内的语料质量和数量都远不如其他语言不如英语还算正常的话比日语还少就离了大谱了所以如果国内想要训练大语言模型就一定要要用别的语言寄希望于模型能通过翻译汲取别的语言里的知识其实这个也不仅仅是大语言模型的问题放到人类世界我们管这个叫留⁠学

不僅不僅僅是大型語言模型的問題還是到底什麼是語言語料質量留學是爲了什麼的問題我雖然不認爲比日語少有什麼離譜可言不過確實有興趣知道是否真的如此以及爲什⁠麼

原載一天世界博客