📚 哈佛发布百万册公有领域书籍AI训练数据集,但仍待托管
哈佛大学宣布发布一个包含近百万册公有领域书籍的免费AI训练数据集,该项目由哈佛大学新成立的机构数据倡议(Institutional Data Initiative)创建,并获得了微软和OpenAI的资助。数据集包含部分来自Google Books项目的已进入公有领域的书籍扫描件。然而,目前该数据集尚未提供下载,因为哈佛大学尚未找到合适的公司来托管这个庞大的数据集。哈佛方面希望与谷歌合作,但谷歌尚未对此作出回应。项目执行理事Greg Leppert表示,此举旨在创建一个公平的竞争环境,让任何人都能访问这些经过高度加工和精心筛选的数据,而不仅仅是科技巨头。
(科技情报)
via 茶馆 - Telegram Channel
哈佛大学宣布发布一个包含近百万册公有领域书籍的免费AI训练数据集,该项目由哈佛大学新成立的机构数据倡议(Institutional Data Initiative)创建,并获得了微软和OpenAI的资助。数据集包含部分来自Google Books项目的已进入公有领域的书籍扫描件。然而,目前该数据集尚未提供下载,因为哈佛大学尚未找到合适的公司来托管这个庞大的数据集。哈佛方面希望与谷歌合作,但谷歌尚未对此作出回应。项目执行理事Greg Leppert表示,此举旨在创建一个公平的竞争环境,让任何人都能访问这些经过高度加工和精心筛选的数据,而不仅仅是科技巨头。
(科技情报)
via 茶馆 - Telegram Channel