GPT-5正式发布,拥有编程、创意写作、健康领域三大优势
当地时间周四(8月7日),OpenAI官方正式推出了备受外界期待的、性能更强的新一代人工智能模型GPT-5。
GPT-5是一个统一的系统,能够识别何时快速响应,何时需要更长时间的思考以提供专家级的应答,不必由用户手动选择使用常规语言模型还是推理系统。
OpenAI在新闻稿中写道,GPT-5的智能性能远超公司之前的所有模型,在编码、数学、写作、健康、视觉感知等领域均拥有卓越的性能。
一键生成网页,像诗人一样写作,更懂健康问题
GPT-5拥有编程、创意写作、健康领域三大优势
根据OpenAI介绍,作为OpenAI的“最强大模型”,GPT-5在三个关键领域实现了显著提升。
首先是编程能力。GPT-5是OpenAI迄今为止最强大的编码模型,在复杂的前端生成和大型代码库调试方面表现突出,能够仅凭一个提示就创建美观响应式的网站、应用程序App和游戏。早期测试者注意到其在间距、排版和留白等设计选择方面的改进。
在从GitHub获取现实世界编码任务的基准测试SWE-bench Verified中,GPT-5思考后首次尝试的准确率达74.9%,高于OpenAI推理模型o3的69.1%和GPT-4o的30.8%。
在创意写作方面,GPT-5能够处理结构复杂的写作任务,如无韵律的抑扬格五音步诗或自然流动的自由诗,犹如诗人。OpenAI的ChatGPT业务副总Nick Turley表示,GPT-5在创意任务上表现出“更好的品味”,响应更自然。
健康咨询是第三个重要提升领域。
GPT-5能更积极地标记潜在健康问题,帮助用户解析医疗结果,尽管OpenAI强调,ChatGPT不能替代医疗专业人员。
在名为HealthBench Hard Hallucinations的测试中,具备思考能力的GPT-5出现幻觉的错误信息率仅为1.6%。这远低于GPT-4o和o3模型,后两者的错误信息率分别为15.8%和12.9%。
先前,OpenAI首席执行官萨姆·奥尔特曼(Sam Altman)称GPT-5是一次“重大升级”,“这还是第一次,真的像是在与某个领域的专家对话。”
ChatGPT团队负责人Nick Turley表示,新模型在响应速度、回答准确性以及减少“幻觉”方面都优于前代产品,“你跟它对话时,会感觉自然了不少。”
在8月7日的简报会上,奥尔特曼对GPT-5给予了极高评价,将GPT-5定位为通往AGI的重要里程碑。他表示:“在以往历史上任何时期,拥有像GPT-5这样的东西都是不可想象的。”
OpenAI表示,GPT-5将面向所有用户开放,Plus会员可获得更多使用量,Pro会员则可访问GPT-5 Pro版本——该版本具有扩展推理能力,可提供更全面、更准确的答案。
微软已将GPT-5整合到Microsoft 365 Copilot、Copilot、GitHub Copilot和Azure AI Foundry等产品中,为企业和消费者提供体验服务。
相关推荐
“外卖健身”火了,体育生新的就业方向,什么是外卖健身?
近期,不少大城市兴起了“外卖健身”业务,成了体育生,健身教练新的就业方向,许多健身中心也加入了进来。什么是外卖健身呢?外卖健身又叫健身外卖,只需通过手机预约,专业
2025-08-10
俄罗斯勘察加发生8.7级地震,沿海多国发布海啸预警
北京时间7月30日7时24分(当地时间7月30日10时24分),在堪察加东岸远海(北纬52.40度,东经160.20度)发生8.7级地震,为73年来该地区的最强地震。
2025-07-30
旺仔小乔是谁,怎么突然火了?旺仔小乔事件整理
根据网上的资料,旺仔小乔原名乔镘凝, 近期因一系列负面争议事件而走红网络。
2025-07-27
新娘怀着别人孩子,结婚第2天跑路,法院判了
7月25日报道,河北邯郸90后女子路某被法院列为失信被执行人后,产生用彩礼偿还几十万赌债的想法,还找他人冒充家人骗取男子赵某的信任,她和男子赵某举办婚礼后,于次日虚构去天津要
2025-07-26
歌手邓紫棋创作发售个人首部科幻小说《启示路》,首日狂销20万册
7月10日,华语流行天后邓紫棋于其个人社交媒体宣布,其创作的首部科幻小说《启示路》正式开启预售。7月11日,邓紫棋工作室发文,“恭喜@GEM鄧紫棋首部科幻爱情小说《启示路》
2025-07-23