思路打开!腾讯造了10亿个角色,驱动数据合成!7B模型效果打爆了
阅8转0刚刚Yandex 开源 LLM 训练工具,可节省高达 20% 的 GPU 资源
阅1转0刚刚“数据虚拟化之父”解密数据编织,大模型时代的数据生产力就靠它了
阅2转0刚刚大模型时代下的数据治理:AI序幕拉开,垂直行业模型如何加速突破?
阅15转0刚刚我让智谱 AI 狂吐训练数据,还发现了它的数据来源
阅82转0刚刚30 个优质 NLP 数据集和模型,一键使用 8 个 demo,建议收藏!| 超全大模型资源汇总
阅38转0刚刚研发大模型的血液--万字长文详谈数据工程
阅53转0刚刚大模型迎来「开源季」,盘点过去一个月那些开源的LLM和数据集
转自 天承办公室刚刚可能是现在最全的NLP中文数据集列表
转自 michael1314520刚刚成不了AI高手?因为你根本不懂数据!听听这位老教授多年心血练就的最实用统计学
转自 张无忌Z刚刚25个免费数据集网站大放送——For 热爱数据科学的你
转自 空明苑刚刚好资源!近 20 万本 txt 书籍的语料库,可用于 GPT 模型训练和语义分析
转自 michael1314520刚刚四个00后的疯狂开源计划:整个互联网转成大模型语料,1亿token嵌入成本只需1美元
阅3转0刚刚最快构建AI应用的embedding数据库,开源了!
阅1227转2刚刚开源界最新力作!230万篇arXiv的论文标题和摘要的所有embeddings向量数据集免费开放!
阅161转0刚刚ChatGPT 时代:阅读会不会被取代?
阅43转0刚刚
-
设计心理学2:与复杂共处
加载中...