歡迎來(lái)到淘金地

OpenAI發(fā)布o(jì)3與o4-mini,支持圖思及工具調(diào)用

來(lái)源: 發(fā)布時(shí)間:2025-04-17

OpenAI發(fā)布o(jì)3與o4-mini,支持圖思及工具調(diào)用

北京時(shí)間 4 月 17 日凌晨,OpenAI 正式發(fā)布了兩款全新 AI 模型 ——o3 和 o4-mini。這兩款模型屬于 “o 系列” 推理模型,能夠通過(guò)圖像進(jìn)行推理,并可自主調(diào)用多種工具,被認(rèn)為是人工智能能力的一次重大飛躍。

o3 和 o4-mini 經(jīng)過(guò)訓(xùn)練,可在響應(yīng)前進(jìn)行更長(zhǎng)時(shí)間的思考,是 OpenAI 迄今發(fā)布的智能、強(qiáng)大的模型。它們能夠自主組合并使用 ChatGPT 內(nèi)的多種工具,包括網(wǎng)頁(yè)搜索、用 Python 分析文件和數(shù)據(jù)、進(jìn)行視覺(jué)輸入推理以及生成圖像等。而且,模型能判斷何時(shí)及如何使用工具,以正確輸出格式,在一分鐘內(nèi)給出詳細(xì)回答,解決復(fù)雜問(wèn)題,使 ChatGPT 具備 “自主執(zhí)行任務(wù)” 的能力。

性能方面,o3 是 OpenAI 強(qiáng)大的推理模型,在編程、數(shù)學(xué)、科學(xué)、視覺(jué)理解等領(lǐng)域取得突破,在 Codeforces、SWE-bench 和 MMMU 等多項(xiàng)基準(zhǔn)測(cè)試中創(chuàng)下新紀(jì)錄,適合復(fù)雜查詢(xún),在視覺(jué)任務(wù)中表現(xiàn)突出。外部專(zhuān)業(yè)人員評(píng)估顯示,在現(xiàn)實(shí)高難度任務(wù)中,o3 的重大錯(cuò)誤率比 o1 降低 20%,在多個(gè)領(lǐng)域表現(xiàn)出色,早期測(cè)試者稱(chēng)其為 “思考伙伴”。

o4-mini 則是更小巧、高效的推理模型,專(zhuān)為快速、低成本應(yīng)用場(chǎng)景優(yōu)化,在數(shù)學(xué)、編程和視覺(jué)任務(wù)上性?xún)r(jià)比驚人,是 AIME 2024 和 AIME2025 基準(zhǔn)測(cè)試中表現(xiàn)的模型之一,在非 STEM 任務(wù)上超越 o3-mini,計(jì)算效率出色,適用于高頻、高吞吐量場(chǎng)景。

在技術(shù)創(chuàng)新上,OpenAI 通過(guò)強(qiáng)化學(xué)習(xí)訓(xùn)練這兩款模型使用工具,并讓它們學(xué)會(huì)判斷使用時(shí)機(jī)。同時(shí),模型可實(shí)現(xiàn)將圖像直接整合進(jìn)推理思維鏈,能 “用圖像進(jìn)行思考”,實(shí)現(xiàn)視覺(jué)與文本推理的深度融合,在視覺(jué)感知任務(wù)中準(zhǔn)確率前列。

OpenAI o3 和 o4-mini 在 ChatGPT 中擁有對(duì)所有工具的完整訪(fǎng)問(wèn)權(quán)限,開(kāi)發(fā)者還能通過(guò) API 接入自定義工具。面對(duì)復(fù)雜問(wèn)題,模型可執(zhí)行一連串工具調(diào)用,靈活應(yīng)變,完成復(fù)雜任務(wù)。

價(jià)格方面,o3 和 o4-mini 在很多情況下比前代更高效、節(jié)省成本。在安全性上,OpenAI 重構(gòu)安全訓(xùn)練數(shù)據(jù)集,新增拒絕示例,使模型在內(nèi)部安全拒絕基準(zhǔn)測(cè)試中表現(xiàn)優(yōu)異,還開(kāi)發(fā)了風(fēng)險(xiǎn)緩解機(jī)制,識(shí)別和標(biāo)記危險(xiǎn)提示。經(jīng)嚴(yán)格測(cè)試,o3 與 o4-mini 在生物與化學(xué)風(fēng)險(xiǎn)、網(wǎng)絡(luò)安全、AI 自我改進(jìn)能力等領(lǐng)域均處于 “低風(fēng)險(xiǎn)” 級(jí)別。

此外,OpenAI 發(fā)布了全新實(shí)驗(yàn)項(xiàng)目 Codex CLI,這是一款輕量級(jí)編程智能體,專(zhuān)為發(fā)揮 o3 和 o4-mini 等模型的推理能力設(shè)計(jì),即將支持更多 API 模型。用戶(hù)可從命令行體驗(yàn)多模態(tài)推理,解決實(shí)際編程任務(wù)。OpenAI 還啟動(dòng)了 100 萬(wàn)美元資助計(jì)劃,支持使用 Codex CLI 和 OpenAI 模型的項(xiàng)目。

從 4 月 17 日開(kāi)始,ChatGPT Plus、Pro 和 Team 用戶(hù)可在模型選擇器中看到 o3、o4-mini 和 o4-mini-high,取代之前的 o1、o3-mini 和 o3-mini-high。ChatGPT Enterprise 和 Edu 用戶(hù)將在一周后獲得訪(fǎng)問(wèn)權(quán)限。其用戶(hù)可點(diǎn)擊 “Think” 按鈕嘗試 o4-mini 的推理能力。OpenAI 還計(jì)劃在未來(lái)幾周推出支持全部工具功能的 OpenAI o3-pro,o3 和 o4-mini 也將通過(guò) Chat Completions API 和 Responses API 向開(kāi)發(fā)者開(kāi)放。

公司信息

聯(lián) 系 人:

手機(jī)號(hào):

電話(huà):

郵箱:

網(wǎng)址:

地址:

新疆派威智研科技有限公司
SaaS智能營(yíng)銷(xiāo)云平臺(tái)
本日新聞 本周新聞 本月新聞
返回頂部