您现在的位置：新闻首页>中介信息

10亿参数的AI模型SEER「一视同仁」：服务富人也服务全世界

　　【新智元导读】一个主要以欧美家庭图片为训练内容的识别系统碰到「尼泊尔」家庭图片时，可能就识别不出，而无需标记、10亿参数的AI模型SEER表现惊人，它「一视同仁」，认得出美国厨房，也认得出尼泊尔厨房。

　　使用经过挑选和标记的数据集对人工智能系统进行训练，产生了专门的人工智能模型，擅长对象识别等任务。

　　但是仅仅依靠这种方法也有实际的局限性，其中一个我们认为特别重要:这样的系统可能难以识别那些日常生活中很常见，但是在训练人工智能系统的数据中「没有被充分代表」的对象。

　　例如，一个主要以「美国和欧洲」家庭图片为训练内容的物体识别系统在被要求识别「尼泊尔」一个家中的物体时，可能难以取得同样好的效果。

　　通过利用自监督学习，SEER可以从任何数字图片集中学习，而不需要研究人员来挑选和标记每个对象。

　　初步评估表明，SEER在识别物体方面比传统的计算机视觉系统表现更好，这些物体虽然来自数十亿人的生活，但在用于训练人工智能系统的传统图片数据集中「体现较少」。

　　我们在2019年的计算机视觉系统偏差研究中使用了「DollarStreet数据集」，对SEER进行测试。SEER给出的结果令人兴奋，自监督学习让人工智能更好地为世界各地的人服务。

　　自监督学习在提高语言和方言的性能方面已经显示出巨大的前景，因为这些语言和方言没有大量的数字化文本作为标记的训练数据来使用。

　　SEER能够在上述例子中更好地进行物体识别，这是另一个令人兴奋的结果，因为该模型是在没有任何数据整理的情况下在随机的互联网图像上训练的。

　　这表明，用于训练SEER的自监督方法可能会对建立人工智能系统的努力产生巨大影响，这种系统不仅能有效地服务富人，而且能有效地服务整个世界。这些努力只是开始，但很明显，我们正在一条非常令人兴奋的进步之路上。

本网转载的作品，目的在于传递更多信息，并不代表本网赞同其观点或证实其内容的真实性，不承担此类作品侵权行为的直接责任及连带责任。其他媒体、网站或个人从本网转载时，必须保留本网注明的作品来源，并自负版权等法律责任。
如涉及作品内容、版权等问题，请联系我们进行修改或删除。