首页 >> 动态 > 每日快讯 >

2024年04月07日报告称OpenAI采集了超一百万小时的YouTube视频来训练GPT-4

2024-04-07 10:01:44 来源: 用户: 

本周早些时候,《华尔街日报》报道称AI公司在收集高质量训练数据方面遇到了困难。今天,《纽约时报》详细介绍了AI公司处理此问题的一些方法,其中涉及到属于AI版权法模糊灰色区域的内容。报道称,OpenAI迫切需要训练数据,并开发了Whisper音频转录模型来克服困难,转录了超过100万小时的YouTube视频来训练其最先进的大型语言模型GPT-4。报道提到,OpenAI在2021年耗尽了有用的数据供应,并在耗尽其他资源后讨论了转录YouTube视频、播客和有声读物的可行性。此外,OpenAI使用了包括来自Github的计算机代码、国际象棋走棋数据库和来自Quizlet的作业内容。

文章转载自:互联网,非本站原创

  免责声明:本文由用户上传,与本网站立场无关。财经信息仅供读者参考,并不构成投资建议。投资者据此操作,风险自担。 如有侵权请联系删除!

 
分享:
最新文章