OpenAI今日發布了兩款突破性AI模型,它們不僅能結合圖像進行推理,還可自主調用工具。專家認為,這標志著人工智能能力的一次質變。

這家總部位于舊金山的公司推出了o3和o4-mini,作為其"o系列"推理模型的最新成員。官方宣稱,這是迄今為止最智能、最強大的模型。這些系統能將圖像直接融入推理流程,在單一任務中完成網頁搜索、代碼運行、文件分析乃至圖像生成等操作。

"有些模型會讓人感覺跨入了未來,GPT-4曾是這樣,今天也將成為這樣的日子。"OpenAI總裁Greg Brockman在發布會上表示,"頂尖科學家反饋稱,這些模型能產出真正優質且實用的創新想法。"

新模型如何"用圖像思考"革新視覺問題解決

最引人注目的功能是其"用圖像思考"的能力——不僅是識別圖像,更將其作為問題解決過程中的可操作元素。

"它們不只是'看'圖像,而是用圖像'思考'。"OpenAI在聲明中解釋道,"這解鎖了融合視覺與文本推理的全新問題解決方式。"

發布會演示環節中,研究員展示了o3如何分析一份十年前的物理實習海報:自主解析復雜圖表后,它甚至發現最終結果并未體現在海報上。"它相當于在幾秒內替我閱讀了至少10篇論文。"OpenAI多模態推理研究員Brandon McKenzie表示,這項任務若由人工完成需耗時數日。

AI能在推理過程中縮放細節、旋轉圖表或裁剪冗余元素,這種主動的圖像操控能力被行業分析師認為將變革從科研到教育的多個領域。

超越模型:o3與o4-mini作為完整AI系統的工具鏈集成

OpenAI強調,這些發布不僅是模型升級,更是能自主串聯多工具的完整AI系統。"我們通過強化學習訓練它們不僅會使用工具,還能判斷何時使用。"公司解釋道。

Brockman舉例說明:"在解決難題時,o3曾連續調用600次工具。"這種能力使模型無需人工干預即可完成復雜工作流。例如詢問加州未來能源使用趨勢時,AI能自動搜索公用數據、編寫Python分析代碼、生成可視化圖表并整合成報告。

OpenAI以破紀錄性能領跑AI競賽

o3在Codeforces、SWE-bench和MMMU等關鍵基準測試中刷新紀錄。獨立評估顯示,其在復雜現實任務中的重大錯誤率比前代降低20%。

輕量化的o4-mini在速度與成本效率上表現突出。使用Python解釋器時,其在2025年AIME數學競賽中取得99.5%的準確率。

此次發布恰逢OpenAI推出專精編程的GPT-4.1后僅兩天,凸顯AI領域競爭白熱化。面對谷歌Gemini、AnthropicClaude和馬斯克xAI的追趕,OpenAI上月剛完成創紀錄的400億美元融資,估值達3000億美元。據悉,公司還考慮建設自有社交網絡以獲取專屬訓練數據。

新模型如何以代碼導航能力變革軟件工程

Brockman坦言:"o3在導航OpenAI代碼庫時比我更高效。"同步發布的還有開源工具Codex CLI,開發者可通過終端直接調用模型推理能力,支持上傳截圖或草圖輔助編程。為推廣使用,OpenAI設立100萬美元基金,為優秀項目提供2.5萬美元API代金券。

OpenAI的安全防護體系

公司宣稱已對模型進行史上最嚴格安全測試,包括重構安全訓練數據集和開發系統級風險標記機制。測試顯示,o3與o4-mini在生物、網絡安全和AI自我進化等高風險領域的潛在威脅均低于"高"閾值。

開放計劃與商業策略

ChatGPT Plus、Pro和Team用戶即日可用,企業和教育客戶下周開放。免費用戶提交查詢前選擇"思考"選項可體驗o4-mini。開發者可通過Chat Completions API和Responses API接入,部分機構需驗證權限。

AI未來:推理與對話的融合

OpenAI指出,此次更新標志著"o系列的專業推理能力與GPT系列的自然對話及工具使用正在融合"。沃頓商學院研究AI應用的Ethan Mollick教授評價o3為"強大但仍有棱角的模型"。

當AI開始像人類一樣將視覺信息作為思維素材而不僅是分析對象時,這種從被動識別到主動視覺推理的跨越,或許比任何基準分數都更具深遠意義——這標志著AI首次真正通過"思考的眼睛"觀察世界。

精選文章:

AI生成字體:機器正在設計字體的未來嗎?

當代海報設計趨勢:大膽字體與鮮艷色彩的視覺革命

為人而設計:卓越用戶體驗背后的心理學

奢侈時尚統治設計界,可持續性依然流行,現代主義回歸

10個手工定制風格代碼,讓你的Midjourney照片瞬間提升時尚感