5月16日消息,據(jù)外媒報道,谷歌近日將為Android操作系統(tǒng)和Chrome瀏覽器推出一系列全新人工智能及輔助功能,旨在進(jìn)一步提升用戶體驗(yàn),尤其是為殘障人士和有特殊需求的用戶提供更多便利。
在安卓系統(tǒng)方面,屏幕閱讀器TalkBack迎來重要升級。去年,谷歌已將Gemini人工智能功能引入TalkBack,使盲人或視力低下用戶即便在圖片缺乏Alt文本的情況下,也能借助AI生成的描述了解圖片內(nèi)容。此次升級后,用戶不僅能獲取圖片描述,還能針對圖片內(nèi)容提出具體問題并獲得解答。例如,當(dāng)收到朋友發(fā)送的新吉他照片時,用戶可詢問吉他的品牌、顏色等細(xì)節(jié)。此外,TalkBack的功能擴(kuò)展至整個手機(jī)屏幕,用戶在應(yīng)用程序購物時,可向Gemini詢問感興趣商品的材質(zhì)、是否有折扣等信息,讓信息獲取更加便捷精準(zhǔn)。

同時,安卓的實(shí)時字幕功能Expressive Captions也進(jìn)行了更新。該功能利用人工智能技術(shù),不僅能捕捉說話內(nèi)容,還能識別說話方式。谷歌注意到人們在表達(dá)時有時會拖長聲音,因此在“Expressive Captions”中新增了時長功能。通過這一功能,用戶能夠分辨出體育播音員是在激動地喊“精彩一擊”,還是有人拉長聲音說“不——”。此外,實(shí)時字幕還將顯示新的聲音標(biāo)簽,如有人吹口哨或清嗓子時,字幕會相應(yīng)標(biāo)注,讓用戶更全面地感知對話場景。此更新將率先在美國、英國、加拿大和澳大利亞推出,適用于運(yùn)行Android 15及更高版本的設(shè)備。
在Chrome瀏覽器方面,谷歌簡化了訪問PDF文檔的操作。此前,桌面版Chrome瀏覽器中,用戶無法使用屏幕閱讀器與掃描的PDF文檔進(jìn)行交互。如今,Chrome借助光學(xué)字符識別(OCR)技術(shù),可自動識別這類PDF文檔,用戶不僅能像瀏覽普通網(wǎng)頁一樣對文本進(jìn)行高亮顯示、復(fù)制和搜索,還能通過屏幕閱讀器閱讀內(nèi)容,極大提升了處理掃描PDF文檔的便利性。
另外,安卓版Chrome瀏覽器的頁面縮放功能也得到優(yōu)化。用戶現(xiàn)在可以在不影響網(wǎng)頁布局的前提下放大顯示文本,還能自定義放大程度,并選擇將首選項(xiàng)應(yīng)用于所有頁面或特定頁面。用戶可通過點(diǎn)擊Chrome右上角的三點(diǎn)菜單訪問該功能,滿足不同用戶對網(wǎng)頁顯示效果的個性化需求。