哈佛与谷歌将发布百万本公共领域书籍作为AI训练数据集

哈佛大学计划发布一个包含约100万本公共领域书籍的数据集,涵盖多种题材、语言和作者,可用于训练大型语言模型。该数据集来自谷歌图书项目,将向研究实验室和AI初创公司等开放,旨在促进AI领域公平竞争。

该数据集的具体发布时间和方式尚不明确。此举得到了微软和OpenAI的资金支持,将为AI研究和开发提供宝贵资源。

TechCrunch

📮投稿机器人 ☘️频道 🌸聊天

via 科技圈🎗在花频道📮 - Telegram Channel
 
 
Back to Top