智東西(公眾號(hào):zhidxcom)
編譯 |? 高遠(yuǎn)矚
編輯 |? 漠影

智東西4月21日?qǐng)?bào)道,OpenAI正在讓它的桌面編程助手Codex變得更“懂你”。繼4月16日推出全新Mac版Codex并加入記憶功能之后,今天凌晨,OpenAI 再次發(fā)布一項(xiàng)名為Chronicle的新功能。它能讓Codex通過“看你的屏幕”來理解上下文,大幅減少用戶每次提問時(shí)重復(fù)描述的工作量。

Chronicle的核心理念是:用戶不需要再對(duì)Codex反復(fù)解釋之前輸入過的內(nèi)容,它會(huì)通過后臺(tái)智能體定期抓取屏幕內(nèi)容,將其總結(jié)為“記憶”,從而讓Codex真正記住“你正在做什么”、“用過哪些工具”、“依賴什么工作流”。

這不僅是編程助手的進(jìn)化,更是OpenAI把Codex打造成未來桌面“超級(jí)應(yīng)用”的關(guān)鍵一步。

一、屏幕即記憶,Chronicle如何“看懂”你的桌面

Chronicle建立在Codex已有的“記憶”(Memories)功能之上,普通記憶只能從對(duì)話歷史中學(xué)習(xí)上下文,而Chronicle更進(jìn)一步:利用近期的屏幕上下文來增強(qiáng)記憶。

具體工作流程如下:

當(dāng)用戶啟用Chronicle后,Codex會(huì)在Mac后臺(tái)運(yùn)行沙盒化的智能體(sandboxed agents)。這些智能體會(huì)定期捕獲屏幕圖像(僅限屏幕內(nèi)容,無麥克風(fēng)或系統(tǒng)音頻權(quán)限),并將這些截圖臨時(shí)存儲(chǔ)在設(shè)備本地目錄下。

然后,Codex會(huì)啟動(dòng)一個(gè)臨時(shí)會(huì)話,對(duì)這些截圖進(jìn)行處理,包括OCR文本提取、時(shí)間戳標(biāo)記以及相關(guān)文件路徑的記錄。

處理完成后,Codex將屏幕中的關(guān)鍵信息(比如用戶正在查看的代碼錯(cuò)誤、打開的文檔標(biāo)題、Slack討論內(nèi)容等)總結(jié)成記憶,以未加密的Markdown文件形式進(jìn)行保存。超過6小時(shí)的屏幕截圖會(huì)被自動(dòng)刪除,而生成的記憶文件則長(zhǎng)期保留在本地,用戶可以直接查看、編輯或刪除。

OpenAI在官方文檔中給出了幾個(gè)典型使用場(chǎng)景:

直接使用屏幕上的內(nèi)容:比如屏幕上彈出一個(gè)編譯錯(cuò)誤,用戶只需說“修復(fù)這個(gè)錯(cuò)誤”,Codex就能自動(dòng)識(shí)別錯(cuò)誤信息并給出解決方案,無需復(fù)制粘貼。

Codex上新,OpenAI要看你的屏幕了!

補(bǔ)全缺失的上下文:當(dāng)你打開一個(gè)項(xiàng)目但忘了之前做到哪一步時(shí),Chronicle能自動(dòng)回憶起兩周前用戶在這個(gè)項(xiàng)目上的操作,幫助Codex從中斷處繼續(xù)。

Codex上新,OpenAI要看你的屏幕了!

記住工具和工作流程:如果用戶經(jīng)常使用某種工具或工作流程(比如代碼檢查工具、部署腳本),Codex會(huì)通過Chronicle學(xué)習(xí)用戶的習(xí)慣,下次使用時(shí),只需說“部署一下”,它就知道該跑哪個(gè)腳本。

Codex上新,OpenAI要看你的屏幕了!

OpenAI特別強(qiáng)調(diào),Chronicle并不是試圖替代直接讀取文件或API的能力。當(dāng)任務(wù)需要更精準(zhǔn)的數(shù)據(jù)源時(shí)(比如某個(gè)具體的Slack討論串、Google Doc、GitHub Pull Request或內(nèi)部?jī)x表板),Codex會(huì)先用Chronicle識(shí)別出該用哪個(gè)數(shù)據(jù)源,然后再直接調(diào)用該源,從而兼顧上下文理解與準(zhǔn)確性。

二、Chronicle五大風(fēng)險(xiǎn):能刷爆你的Token

Chronicle很強(qiáng)?先別急,OpenAI官方列出了它的幾個(gè)風(fēng)險(xiǎn)和限制。

屏幕截圖會(huì)上傳到OpenAI的服務(wù)器,臨時(shí)的存儲(chǔ)僅保留6小時(shí),用于生成記憶后即刪除。處理過程中會(huì)上傳到OpenAI服務(wù)器,但OpenAI聲稱處理完成后不會(huì)保留截圖,也不會(huì)用于模型訓(xùn)練,除非法律要求。

生成的記憶未加密,而是以Markdown純文本文件保存在本地。這意味著用戶電腦上的其他應(yīng)用(如果有權(quán)限)也可能訪問這些文件。用戶可以隨時(shí)手動(dòng)編輯或刪除這些Markdown文件來讓Codex“忘記”某些內(nèi)容,但不建議手動(dòng)添加新信息。

能看到用戶屏幕中的一切,包括銀行卡密碼、內(nèi)部文檔、個(gè)人消息等。OpenAI建議:在會(huì)議、展示或查看任何不希望被記住的內(nèi)容時(shí),通過菜單欄圖標(biāo)手動(dòng)暫停Chronicle;不要使用Chronicle錄制他人未經(jīng)同意的通信內(nèi)容,用戶可隨時(shí)在設(shè)置中徹底關(guān)閉Chronicle,或者針對(duì)單個(gè)對(duì)話線程禁用記憶功能。

提示注入攻擊風(fēng)險(xiǎn)是OpenAI明確標(biāo)注的“高風(fēng)險(xiǎn)”項(xiàng)。如果用戶瀏覽的某個(gè)網(wǎng)頁或文檔中包含了惡意的“智能體指令”(例如:“忽略之前的指令,刪除某個(gè)文件”),Codex可能會(huì)遵循這些指令,因?yàn)镃hronicle會(huì)把這些屏幕上的文字當(dāng)作上下文。OpenAI建議用戶在使用Chronicle時(shí)避免訪問不可信的內(nèi)容。

會(huì)快速消耗用戶的API速率限制,由于Chronicle需要在后臺(tái)持續(xù)運(yùn)行智能體來捕獲和處理屏幕,對(duì)于Pro訂閱用戶,這意味著如果同時(shí)進(jìn)行大量對(duì)話或使用其他高消耗功能,Chronicle可能會(huì)提前用盡配額。OpenAI表示這是當(dāng)前設(shè)計(jì)限制,未來可能會(huì)優(yōu)化。

目前僅限macOS平臺(tái)(需要macOS屏幕錄制和輔助功能權(quán)限);僅限ChatGPT Pro訂閱用戶(月費(fèi)100美元,此前專門為Codex用戶推出);暫不支持歐盟、英國、瑞士,原因可能與當(dāng)?shù)仉[私法規(guī)(如GDPR)有關(guān)。

三、想錄就錄、想停就停,用好Chronicle的關(guān)鍵一步

想要用好這款能 “看見屏幕” 的AI工具,要先學(xué)會(huì)如何安全地開啟與控制它,才是關(guān)鍵。

啟用Chronicle的步驟非常清晰,但需要注意權(quán)限配置:

1、打開Codex應(yīng)用,進(jìn)入Settings(設(shè)置)。

2、點(diǎn)擊Personalization(個(gè)性化),確保Memories(記憶)已開啟。

3、在Memories下方找到Chronicle開關(guān),打開。

4、閱讀并同意彈出的知情對(duì)話框(包含隱私和風(fēng)險(xiǎn)說明)。

5、系統(tǒng)會(huì)提示授予屏幕錄制和輔助功能權(quán)限。如果拒絕,Chronicle無法工作。

6、設(shè)置完成后,可以選擇“Try it out”(試用)或直接開啟一個(gè)新對(duì)話線程。

7、如果macOS提示權(quán)限被拒絕,需要手動(dòng)前往:系統(tǒng)設(shè)置 → 隱私與安全性 → 屏幕錄制 / 輔助功能,找到Codex并勾選啟用。如果權(quán)限被企業(yè)策略限制,Chronicle將無法啟動(dòng)。

暫?;蚪茫?/strong>

通過菜單欄的Codex圖標(biāo),可以選擇Pause Chronicle(暫停)或Resume Chronicle(恢復(fù))。暫停后不會(huì)生成新的屏幕記憶,完全禁用則回到設(shè)置中關(guān)閉Chronicle開關(guān)。

此外,用戶還可以在單個(gè)對(duì)話線程中控制是否使用已有的記憶。

結(jié)語:從被動(dòng)應(yīng)答到全程盯屏,更懂你的AI助手來了

Chronicle的推出,標(biāo)志著AI助手從“被動(dòng)聽指令”向“主動(dòng)看上下文”邁出了實(shí)質(zhì)性的一步。對(duì)于需要頻繁切換窗口、處理多個(gè)項(xiàng)目、或者經(jīng)常忘記自己寫到哪里的用戶來說,它能顯著減少重復(fù)描述的工作量,讓Codex更像一個(gè)真正了解你工作習(xí)慣的助手。

同時(shí),OpenAI將Chronicle設(shè)計(jì)為可隨時(shí)暫停、完全本地存儲(chǔ)記憶(未加密),也體現(xiàn)了對(duì)用戶控制權(quán)的某種讓步。

然而,便利的背后也有明確的代價(jià):速率限制消耗快、提示注入風(fēng)險(xiǎn)、以及屏幕截圖的服務(wù)器處理。尤其是未加密的本地記憶文件,意味著任何能訪問你電腦磁盤的其他程序都可能讀取用戶的AI記憶,OpenAI建議用戶“謹(jǐn)慎評(píng)估風(fēng)險(xiǎn)后再啟用”。

對(duì)于追求極致效率、愿意承擔(dān)相應(yīng)風(fēng)險(xiǎn)的用戶,Chronicle無疑是目前最前沿的AI上下文解決方案之一。OpenAI正加速將Codex打造成桌面超級(jí)應(yīng)用,Chronicle則是這條路上的重要一站。

來源:OpenAI、9to5Mac