大模型扎堆「赶考」,语文还是国产AI行,文言文能力超过95%考生_当前时讯
鱼羊 萧箫 发自 凹非寺
量子位 | 公众号 QbitAI
(资料图)
ChatGPT诞生后的第一场全国高考,考生忙,大模型们也很忙。
这不,高考还没结束,AI挑战高考题就成了刷屏热搜话题,各家大模型都被拉出来写起了高考作文,甚至是参与整场考试。
(不知是不是巧合,Bard还在下午数学高考后,紧急升级了一波数学推理能力……)
结果,竟然有大模型写的作文,把资深高中老师都骗过了!
就在考试当天,百度搜索正在内测的“AI伙伴”,现场直播挑战了一套语文试题。
从“基础题”文言文翻译、阅读填空、古诗词赏析,到“拉分题”微写作和作文,AI伙伴全部上手做了一遍。
结果,当9份“混进”了AI伙伴作品的高考作文送到语文老师庄临旭手上时,他完全没发现有篇是AI写的:
我是真没想到,AI还能写文言文作文。
紧接着,AI伙伴展现的文言文理解能力,更是把资深老师吓了一跳:
凭借我的教学经验来看,超过95%的同学没问题。
一整场直播下来,就连围观了AI伙伴考试全程的毕导都感慨:
再来一次高考语文,我可能考不过它……
所以,集成了百度语义检索技术+大模型能力于一身的AI伙伴,整场考试表现具体如何?
咱们一项一项展开来看。
“AI考生”现场挑战语文高考
先来看看大模型的“基础题”——古诗词赏析。
面对情感和写法的“找不同”问题,百度搜索AI伙伴胸有成竹,不仅给出了明确的修辞手法,还进一步分析了古诗的来历和情感,属实是阅读理解十分到位了:
再到阅读填空。面对文章解读和“续写句子”能力,AI伙伴同样毫不逊色:
那么,来看看大模型的“拉分题”写微作文,依旧没什么问题!
要是小作文体现不出来,再来看看AI伙伴作诗的能力。不仅现代诗手到擒来,甚至连藏头诗都能搞定:
不过,要是再仔细一点搞搞提示词工程,AI伙伴似乎就答得更好了。
以高考语文题目中的古诗词理解为例,这里我们先在不给提示词的情况下,把题目原样“喂”给AI伙伴:
AI伙伴给出来的答案虽然也不错,但对于高考题目来说,这答案着实有亿点长,也有点太仔细了:
接下来,给AI伙伴换上强调“最重要的三个意象”的提示词。
果然,AI给出了更精准的回答,指出包括病柏、丹凤和鸱鸮在内的三个意象,是最关键的:
但是,上述都还只是直播中展现出来的效果。像AI伙伴这类有大模型加持的功能,其使用效果是否真的和提示词工程强相关?
为了测测AI伙伴的“真正实力”,我们亲自上手测了测它做高考题的效果。
直播中已经做过了全国甲卷的作文题目,那么我们再来试试今年上海卷的作文。
第一轮,我们直接把题目甩过去:
看起来,AI伙伴虽然理解了文章“主旨”,但写出来还差点意思:论点不够明确,作文的结构也不太清晰。
第二轮,我们试着换了一下提示词,给AI伙伴设置一个“角色扮演”效果。
首先,强调它是一名高考考生,然后给它“灌输”一些高考作文的写作技巧:
这一轮,AI伙伴写得就有高考作文内味了。
不仅给出了10字以内的标题,还按照总分总、夹叙夹议的方式,很好地写出了一篇议论文:
看起来,挖掘大模型的潜力,很大程度上确实要依靠提示词工程。
在直播中,百度集团副总裁、搜索平台负责人肖阳还给我们列举了一个非常简洁的提示词公式:
提示词 = 任务 + 角色 + 上下文背景 + 细节补充。
有了它,不用再担心大模型输出和设想无关的答案了。
当然,作为百度“用大模型重塑搜索能力”的终极杀器,AI伙伴能实现的功能,也远不止是做做高考题而已。
最早在2023万象·百度移动生态大会上官宣发布的AI伙伴,目前已经开启内测,获得试用资格后,可以直接从百度搜索界面进入:
它的本职工作,更像是一个搜索引擎端的全能AI助理,不仅具有智能搜索能力,还兼具创作生成技艺:
一方面,AI伙伴相当于一个对话版智能搜索工具。用它查资料,不需要再按关键词搜索,直接“用人话”提问就行:
不仅如此,每一句回答都有理有据,如果想要“追根溯源”,直接点链接就能跳转到对应的网站:
这样一来,就不用担心它会出现像ChatGPT整理文件那样,出现“无中生有”一些案件的操作了。
另一方面,它又相当于一个多模态大模型创作助手。
不仅可以帮助查资料、写周报、画头像,还能陪你模拟面试、甚至替你约会(?)。
这里我们借助AI伙伴的“程序猿小助手”,来试试生成一段代码的能力。
以面试可能会考到的冒泡排序算法为例。
很快啊,几乎没有怎么思考,AI伙伴就给出了一段带注释的冒泡排序算法,最关键的是,它自己已经运行过,并成功输出了一段结果!
这意味着我们不需要再自己去跑一遍这段代码,而是能直接将它交给面试官了(doge)
从上面这些展现的能力来看,AI伙伴所能做到的,远非仅仅提供高考试题“参考答案”而已。
这次选择用它挑战高考题,大家伙可能看的是个新鲜劲儿,但“术”的表象之外,更值得关注的是“道”的变化:
使得AI伙伴能在高考题面前依旧“神采飞扬”的大模型技术,正在以搜索引擎的代际变革为基点,席卷各行各业,甚至改变每个人的工作方式。
正如ChatGPT搅动风云之初,微软CEO纳德拉预测的那般:搜索正面临巨变。
并且变化的不仅仅是搜索的技术、产品本身,这一次,更与每一个个体有了更紧密的关联。
搜索三变
百度CEO李彦宏同样认为,“大模型即将改变世界”。基于这样的判断,李彦宏2023年一季度OKR,便指向了“引领搜索体验的代际变革”。
现在,三个月过去,大模型究竟如何变革搜索,现在答案已经越来越清晰。
从技术的角度出发,大语言模型的爆发,正在重新定义人机交互。
对于人类而言,最自然的交流方式就是语言沟通。而大模型的代际突破,最直观的一点体现,就是机器自然语言聆听和表达能力的飞速提升。
△回答来自百度搜索AI伙伴
搜索本身,就是一种人机交互的核心方式。其本质的技术追求,就是要让机器更高效地理解、推理、表达,化复杂问题为直观的第一条搜索结果。
因此可以说,大语言模型的突破,正在全面激发搜索全新的潜能。
值得关注的一点是,伴随着AI的发展,搜索始终都是最前沿AI技术最先落地的场景。
以百度搜索为例,围绕“降低用户表达需求门槛”、“降低用户获取内容和服务的门槛”、“丰富搜索引擎的内容供给”这三个目标,百度搜索一直在AI技术上大量投入。
引入大模型之前,百度搜索已经实现:
千亿级全网索引;
全球领先的深度语义理解技术,相关成果曾获2020年国家技术发明奖二等奖;
最大中文知识图谱,覆盖50亿实体。
从产品的角度看,过去三个月,数据已经证明,对话式搜索正在成为搜索引擎市场的一个新变量。
百度集团副总裁、搜索平台负责人肖阳就透露,大模型加持下的AI伙伴,在内测阶段就已爆火,相关搜索问答量激增。
这进一步佐证大模型带来的新人机交互方式,更能满足人们对搜索“快速”、“有效”的诉求。
牵一发而动全身,在现在这个时间节点,围绕搜索的内容生产和创作领域,创新模式也开始逐渐显现,并被积极地探索实践。
同样是在万象大会上,百度搜索还配合AI伙伴,推出了AI BOT解决方案。目的就是向内容、服务生产者释放大语言模型和AI技术能力,降低其与新搜索模式融合的门槛。
具体来说,百度搜索提供了创作者、商家、机构、服务和品牌等各类型的AI BOT,让他们能够利用自身优势和独特的内容、知识、服务,创造虚拟分身,直接回答用户的问题。
在技术和产品之外,更与每个人息息相关的,是用户搜索方式的改变。
正如前文所展示的,大模型时代,“提问题”的能力正在变得越来越关键。
体现在现阶段,就是提示词写得好不好,会直接影响搜索生成结果的质量。是否掌握提示词工程能力,就像互联网时代开启时,是否掌握搜索能力一样关键。
对此,肖阳提到了“搜商”的概念:
未来不仅要卷智商、情商,还要卷“搜商”。
更好地使用提示词,更好地使用AI伙伴,获得的优势会越来越大。
也就是说,找到合适提示词的能力越强,越能在大模型落地应用的时代里,充分利用大模型的强大生产力。
可以说,大模型刮起的时代风暴之下,搜索三变,既是内在技术瓶颈的代际突破,亦是外在人类接触信息方式的彻底变革。
无怪乎肖阳作为技术变革的一线亲历者,会有这样的判断:
语义检索技术与大语言模型结合,促进搜索的理解、推理、组织和创作潜能进一步释放,有望在多方面催生颠覆式创新,促成搜索奇点降临。
并且这一次,或许每一个人都会真真切切感受到这种代际变革带来的影响。
One More Thing
说起来,就在高考这两天,AI加持下的百度搜索,忙的还不止有刷题这件事儿。
每年此时,百度都会启动专门的高考服务,通过搜索和AI核心技术,为考生和家长提供便利。
今年,百度还基于AI技术,首次推出了高考搜索指数,涵盖专业搜索热度及变化趋势、“院校PK”等信息。考生家长在择校选专业的时候,可以更方面地参考对比。
AI志愿助手也进行了重大升级,能更直观地展示志愿预测结果,提供相关数据来辅助考生家长做决策。
对了,利用高考搜索指数和其他高考相关搜索数据,百度还联合中国教育在线掌上高考发布了不少有意思的数据:
高校方面,搜索热度最高的本科院校里,南方高校霸榜双一流和非双一流大学前十。
专科院校中,山东是搜索职业教育最多的省份。
专业方面,医学搜索热度断层第一,航空航天热度攀升最快。
而最有“钱”景的,是船舶电子电气工程……
标签:

进入了发展快车道 冷链行业市场规模正在快速膨胀
2022-03-21

行业正站在风口 数字化时代在为传统的自行车产业赋能
2022-03-21

以做强实体经济支撑为重点 成都单个项目年度计划投资同比提升
2022-03-21

拥有多个国际赛事的直播版权 广州游戏电竞企业业绩向好
2022-03-21

投诉量激增 直播带货存在这么多问题的主要原因是什么?
2022-03-21

工作专班深入到各企业 春寒料峭挡不住松原市施工热情
2022-03-21

引导企业向提供“产品+服务”转变 湖南加快智能农机服务化转型
2022-03-21

创新平台建设和科技成果转化 德州加大力度重奖创新
2022-03-21

潜在风险进一步放大 商品房现房销售已是大势所趋
2022-03-21

有序复工复产 1—2月份工业经济发展新动能持续增强
2022-03-21
进入了发展快车道 冷链行业市场规模正在快速膨胀
行业正站在风口 数字化时代在为传统的自行车产业赋能
以做强实体经济支撑为重点 成都单个项目年度计划投资同比提升
拥有多个国际赛事的直播版权 广州游戏电竞企业业绩向好
投诉量激增 直播带货存在这么多问题的主要原因是什么?
工作专班深入到各企业 春寒料峭挡不住松原市施工热情
引导企业向提供“产品+服务”转变 湖南加快智能农机服务化转型
创新平台建设和科技成果转化 德州加大力度重奖创新
潜在风险进一步放大 商品房现房销售已是大势所趋
有序复工复产 1—2月份工业经济发展新动能持续增强
多层次高频调度 1至2月河北省工业运行先行指标稳中有增
以车路协同为基础 智能交通推动城市交通绿色高质量发展
人才短板成为制约产业链高质量发展的关键节点
通过技术手段整合调配供给资源 家政行业不断提质扩容
强化产业链深层次合作 加强重大装备国产化“一条龙”模式构建
如何进一步提升纳税人缴费人的减税降费获得感?
探索建设大数据及网络安全示范试点城市有哪些积极意义?
对制造业中小微企业实施缓缴税费政策有哪些积极意义?
进一步增强自我保护意识 消费者需注意辨别谨慎消费
将“走出去”变“请进来” 西安贸易产业转移承接作用不断得到增强
厦门应如何融入“数字中国”的重大战略发展大局?
江苏省如何不断满足老人日益增长的养老服务需求?
建设一体化的职业健康信息管理平台 天津职业人群保障加强
潜力持续释放 1—2月乡村消费品市场恢复略好于城镇
直接对接社会化服务 楼宇调解室将整体提升青岛劳动争议水平
成功化解纠纷11.47万件 银保监会服务质量日趋提高
春雷响百虫出 惊蛰文化在其他方面有了进一步发展
青绿山水画在古代山水画发展史上有着怎样的影响与地位?
开播即爆款 “文化类节目收视率低”这一固有印象被推翻


- 大模型扎堆「赶考」,语文还是国产AI行,文言文能力超过95%考生_当前时讯
- 淮北市智辰商贸有限责任公司(关于淮北市智辰商贸有限责任公司介绍) 环球热消息
- 投资逾7500万!顺义这个老旧小区试点改造工程进行中!|天天热点
- 慷明咨询KONMET创始人兼CEO邹琪:借鉴国际经验为文旅项目添砖加瓦!_天天观点
- EDG.Uzi的可能性分析:基本不可能,除非EDG能拿出豁出去的勇气
- 天天日报丨浙江力诺:实控人、一致行动人等拟减持不超3.49%股份
- 江苏一母亲致俩幼女饿死,法院:审判时她已怀孕,判处无期徒刑
- 养老金调整细则公布了吗?怎么调整?2023企退人员和单位退休人员,养老金涨钱差多少?
- 2023年最新!海淀小升初一派结果出炉,1.37万人成功“上岸”
- 今日热议:6月8日养老金调整方案公布了?达到65岁的能多涨钱?包括你吗?
- 涵盖了109件真迹作品 凯斯·哈林展览将持续至6月13日
- 带有一点自信的自嘲 “隔路”是另一种味道的“凡尔赛”
- 与文渊阁前后呼应 “何以中国”特展隆重致敬文化大成
- 严重者可造成暂时性失明 享受冰雪运动要注意眼睛的健康防护
- 种类繁多让人眼花缭乱 选购牛奶时需要重点关注什么?
- 网课让孩子感到不安焦虑怎么办?八问八答回应广大家长关切
- 循环系统很容易受到刺激 “倒春寒”期间老人该如何做?
- 青少年患者睡眠问题日趋增加 9条建议为孩子助眠
- 我国肥胖人群正逐年递增 不良饮食习惯是重要诱因
- 如何减少噪声对听力的损伤?这份耳部和听力保健小贴士请收好
- 强化住房限购措施 西安限购限售范围进一步扩大
- 多种方式增加供给 进一步降低新市民和青年人的居住成本
- 预计9月下旬海口可实现安居房申请网上办理
- 政策调控力度持续升级 8月百城二手房市场均价止涨转跌
- 8月中国新房找房热度依然保持平稳 环比微涨0.2%
- 进一步加强商品房销售价格备案管理 今年全国楼市调控刷新历史纪录
- 西安第二批集中供地中28宗为现场拍卖方式出让
- 细分化需求得到释放 房屋居住的属性越发凸显
- 佛山顺德龙江近日挂牌商住地起拍价约19.88亿元
- 青岛市4宗地竞品质抽签结果出炉 地溢价均约15%
- 坚持政策支持、多方参与 浙江版保障性租赁住房明确新增比例目标
- 简化审批流程 武汉将实现房源申请配租全程网上办
- 哈尔滨新增本土确诊病例3例 活动轨迹公布
- 哈尔滨市公布3例新增本土新冠肺炎确诊病例活动轨迹
- 山东深耕文化资源 推动旅游业高质量发展
- 今年新增952件(套)!南京大屠杀再添新证
- 四川非遗传承人张雄志:巧手捏面塑 指尖传非遗
- 10月以来我国寒潮为何如此频繁?中国气象局回应
- 56位残疾人士登上黄山 互利互勉共建生活希望
- 安徽潜山两车相撞 已致8人死亡3人受伤
- 上海洋山海关首次在出口货运渠道查获夹带卷烟
- 山西忻州古城:一城风华延续千年历史文脉
- 呼伦贝尔新巴尔虎右旗公布1例无症状感染者行动轨迹
- 新增“53+1” 内蒙古累计本土确诊病例增至185例
- 昆明公安打击破坏生物多样性犯罪 抓获130名涉案嫌疑人
- 山西朔州“11·11”较大透水事故调查报告发布 对38人问责处理
- “海关国门小卫士”竞争上岗 淘汰率接近一半
- 深圳摧毁特大品牌化妆品走私网
- 28人被问责!山西石港煤业“3·25”事故调查报告公布
- 湖南韶山以河长制带动全民治水 让每一处水面“长治久清”
- 上海市奉贤区人大常委会原党组书记袁晓林被“双开”
- 民进会员谈反映社情民意信息工作:心怀大我 敢讲实情
- 80岁“留守”奶奶短视频诉孤独 千万网友心疼:我们陪您唠嗑
- 40年来为子弟兵送出1.3万余双布鞋和鞋垫的“布鞋奶奶”走了
- 当男幼师是什么体验?他们说:有委屈尴尬 但大部分是幸福
- 庐阳警方通报幼童坠亡事件:嫌疑人已被刑拘
- 内蒙古新增本土确诊病例53例、本土无症状感染者1例
- 哈尔滨市启动部分地区第一轮全员核酸检测
- 四川通江发生两车相撞事故 致3人死亡
- 11月谣言在“身边”,别信这些无稽之谈