个特定的词在给定的上下文中属于哪个词性,这可能会导致语言学家在他们之间争论数小时。(谷歌 )助手,例如,年由大约 名博士生组成。语言学家。在接受连线杂 ws号码列表 志采访时,谷歌产品经理大卫奥尔解释了该公司如何仍然需要其博士生团队。标记词 ws号码列表 性(称之为“黄金”数据)的语言学家,以帮助神经网络理解人类语言如何工作的方式。 谈到 :“团队涵盖 20 到 30 种语言。但希望像谷歌这
样的公司最终能够转向一种更自动化的人工智能形式,称为“无监督学习”。 2019 年,Pygmalion 团队是一支由全球 名语言学家组成的大军,由长期和代理员 ws号码列表 工组成,但由于工作的艰巨性和艰巨性以及所涉及的长时间工作,并非没有挑战. .在同一篇《连线》文章中,深度学习公司 的创始人 Chris 评论了 等项目的不可扩展性,特别是从国际化的角度来看,因为应 ws号码列表 该进行一些语音标记。由来自世界所有语言的语言学家真正做到多语种。会话研究的国际化 中涉及的手动标记似乎没有考虑
到计算语言学的可转移自然现象。例如,频率功率分布定律 定律规定,在任何给定语言中,单词的分布频率与其等级上的频率成正比,即使对于尚未翻译的语言也是如此。 (循环神经网络)中“上下文窗口”的单向性质 训练模型(例如 -和连续词袋)是单向的,即包含 ws号码列表 目标词的弹出窗口以及在左侧和上围绕它的上下文词右边只有一个方向。目标词之后的词 ws号码列表 还没有看到,所以句子的整个上下文直到最后一个词都是不完整的,这会带来丢失一些上下文模式的风险。 Jaco 在 AI 博客上谈到