AI在历史知识领域显露短板:大型语言模型应对复杂历史问题力不从心
科技
2025-01-20 10:15:35
导读 近期研究表明,人工智能在处理复杂历史问题上表现不佳。在NeurIPS会议上公布的研究中,OpenAI的GPT-4、Meta的Llama和谷歌的Gemini三款大型...
近期研究表明,人工智能在处理复杂历史问题上表现不佳。在NeurIPS会议上公布的研究中,OpenAI的GPT-4、Meta的Llama和谷歌的Gemini三款大型语言模型在历史知识测试中的准确率均较低,其中表现最佳的GPT-4 Turbo准确率仅为46%。研究指出,这些模型在基本史实方面表现尚可,但在深入历史研究时力不从心,且在处理特定地区历史问题时表现更差,反映出训练数据可能存在的偏差。然而,研究团队对AI在历史研究中的应用前景仍持乐观态度,并正在改进测试基准以开发更优秀的模型。
研究人员认为,AI在处理细微历史细节时力不从心,倾向于从主流历史叙事中进行推断,这限制了其在历史领域的准确性。尽管AI在某些专业领域尚无法取代人类专家,但研究团队仍在努力改进,以期提升AI在历史研究中的表现。
免责声明:本文由用户上传,如有侵权请联系删除!
猜你喜欢
- Perplexity AI竞逐TikTok,提出突破性合并新蓝图
- OpenAI 重磅推出 GPT-4b micro 模型,助力人类寿命延长十年
- 日产汽车全球范围精简人员9000名,高层管理岗位同步缩减
- 比亚迪双旗舰汉L、唐L内饰官图惊艳亮相:尽显东方美学韵味
- 明日启动!国家手机购新补贴政策详解图表速览
- 结婚登报风靡年轻群体,520元起定格浪漫记忆
- 谁在幕后推动小红书老股交易?
- 17.4万立方米巨轮丽梅尔号在上海荣耀交付
- 多家快递公司春节不打烊,确保客户物流需求无忧
- 1月20日手机数码国补政策正式实施:厂商紧急备货超千万台应对市场需求
- 海南航空正式回应波音客机备降南昌事件:否认发动机失效传闻,已安全处置
- 奇迹!414斤男子坚持382天断食,成功减重250斤
最新文章
- AI在历史知识领域显露短板:大型语言模型应对复杂历史问题力不从心
- 央企纷纷设立创投基金,为战略新兴产业发展注入活力源泉
- 环球中国年庆典:新春欢乐盛宴盛大启幕
- 吉利银河L6 EM-i轿车预售盛大启幕
- 植物大战僵尸:异化时空最新官方下载地址及安装指南
- 新型磁光存储器:加速超快计算的突破性进展
- 世界旅游城市形象大使大赛湖北赛区盛大启动,中国区组委会致贺电
- 洛杉矶国际机场惊险一幕:空管紧急连呼三次Stop,两机险些空中碰撞!
- 崩坏星穹铁道:高效攻略丰饶玄鹿BOSS战
- 高效新型系统直接从大气中捕捉CO2
- 北海至涠洲岛两日游精致攻略
- 短视频是否正在悄然侵蚀你的大脑?
- 新能源车型年度渗透率仍未触及47%大关
- 湖北省黄陂姚姚线探亲之旅
- 2025年我国安全应急产业预计突破2.8万亿元大关
- 大寒节气:马铃薯公主的长白小镇雪地终章狂欢
- 巴蜀文化旅游走廊建设:深化实践,步履坚实
- 宫廷风云:深度解析玩法与魅力,抢先体验古风大戏
- 中信建投深度分析:供需失衡下,锑价中长期上涨趋势明确
- 深圳艺术团埃及巡演完美落幕,埃及观众热切期盼《咏春》全剧
- 乐道官方澄清:关于强制员工购车传闻的不实信息
- 《Again》手游深度解析:玩法特色与剧情介绍
- 两市融资余额大幅下滑67.2亿元
- 《乱乱屋》游戏魅力探索:玩法亮点与预约攻略