做 PPT,是很多人很頭疼的工作。
假如你也有異樣的懊惱,不如嘗嘗「微軟小蜜」小法式。有了它,你只需上傳幾張圖片,就可以輕松制造悅目的 PPT。
這款看似簡(jiǎn)略的小法式的面前,隱蔽著微軟在人工智能和深度進(jìn)修范疇內(nèi)的年夜量積聚和經(jīng)歷。可以說,「微軟小蜜」制造的每份 PPT 面前,都含有微軟工程師的研討結(jié)果。
明天,知曉法式約請(qǐng)到微軟 Office 365 中國(guó)團(tuán)隊(duì)資深產(chǎn)物司理張鵬,讓他為我們揭秘在「微軟小蜜」面前,究竟有甚么兇猛的處所。
為何會(huì)選擇微信,做一個(gè) PPT 小法式?
張鵬引見,他地點(diǎn)的是微軟 Office 365 立異團(tuán)隊(duì),重要面向中國(guó)市場(chǎng)停止任務(wù)。
他們的目的之一就是將 Office 365 產(chǎn)物在 PC 真?zhèn)€壯大臨盆力,集成到挪動(dòng)端。在中國(guó),簡(jiǎn)直一切挪動(dòng)互聯(lián)網(wǎng)用戶都邑應(yīng)用微信,所以,微信天然就成了這個(gè)團(tuán)隊(duì)的目的之一。
我們外部的項(xiàng)目開辟代號(hào)叫「龍門籌劃」,從名字看你就可以明確,這個(gè)項(xiàng)目完整是中國(guó)發(fā)明的。
這個(gè)團(tuán)隊(duì)對(duì)新平臺(tái)的敏感水平不亞于任何創(chuàng)業(yè)團(tuán)隊(duì)。在 1 月 9 日微信正式開放小法式平臺(tái)后不久,「微軟小蜜」就成為首批推出的小法式之一。
張鵬告知我們,之所以這么早進(jìn)入微信小法式范疇,緣由有兩個(gè)。起首是微信平臺(tái)得天獨(dú)厚的用戶量?jī)?yōu)勢(shì)。稀有據(jù)統(tǒng)計(jì)解釋,用戶天天在微信里的時(shí)光要占總手機(jī)應(yīng)用時(shí)光的 35%,也就是說,均勻一個(gè)用戶天天有跨越三分之一的時(shí)光都在微信外面。
你的接洽人早就從親人同伙擴(kuò)大到公司同事和協(xié)作同伴,群聊曾經(jīng)是不單單是家人之前的溝通,許多群曾經(jīng)是用于辦公協(xié)作等任務(wù)場(chǎng)景。
而小法式生成的優(yōu)勢(shì)就是不消下載,可以疾速進(jìn)入運(yùn)用,而且可以進(jìn)入微信群聊便于更快更高效的協(xié)作。
偉大的用戶量和粘性,和小法式平臺(tái)的「無(wú)需下載」特征,都讓 Office 365 進(jìn)入小法式變得再正常不外。應(yīng)用 Office 365 臨盆力平臺(tái),經(jīng)由過程微信小法式完成一件任務(wù),再直接進(jìn)入群聊停止需要的溝通和協(xié)作,對(duì)用戶來講是一件異常天然的方法。這也是我們第一時(shí)光試水小法式的初志。
除此以外,張鵬還以為,小法式開辟本錢和獲客本錢絕對(duì)較低,便于相似人工智能等新技巧的疾速試錯(cuò)和驗(yàn)證。
關(guān)于微軟外部的立異團(tuán)隊(duì),我們除 Office 365 這個(gè)壯大臨盆力平臺(tái)以外,還有對(duì)人工智能運(yùn)用的研討。從今朝全部行業(yè)來看都面對(duì)一個(gè)難點(diǎn):技巧走的很靠前,然則很零碎。若何把人工智能技巧推動(dòng)到產(chǎn)物化這條途徑下去,構(gòu)成一個(gè)端到真?zhèn)€產(chǎn)物,須要疾速驗(yàn)證和迭代。
決議做小法式以后,「要做甚么小法式」同樣成為了張鵬地點(diǎn)團(tuán)隊(duì)須要關(guān)懷的工作。那為何會(huì)選擇做「圖片辨認(rèn)文字轉(zhuǎn) PPT」這類小法式呢?
張鵬給出的謎底是:我們是想摸索一下將來挪動(dòng)端文檔的生成方法。
在 PC 端年夜家習(xí)氣于鍵盤、鼠標(biāo)和打印機(jī)的文檔生成方法,但是在手機(jī)端這些就都不靈了,在手機(jī)上,我們可以應(yīng)用的是攝像頭、語(yǔ)音輸出和多點(diǎn)觸控屏幕。
另外一方面,張鵬和他的團(tuán)隊(duì)以為,年夜部門對(duì)用戶有價(jià)值的資本,都是在手機(jī)端被發(fā)明的,相似現(xiàn)場(chǎng) PPT、創(chuàng)意海報(bào)、畫在黑板上的流程圖,或是微信"號(hào)文章,等等。
用戶將這些信息「縫合」進(jìn) Office 文檔中,常常是比擬艱苦的,也很耗時(shí)辛苦。假如小蜜可以贊助用戶疾速完成這個(gè)舉措,用很短的時(shí)光提取有價(jià)值內(nèi)容,這自己對(duì)用戶就是有價(jià)值的,由于幫用戶節(jié)儉了時(shí)光。
「微軟小蜜」小法式的概念,很像微軟 Office 的另外一款產(chǎn)物:Sway
那為何是「縫合」,而不是「珍藏」呢?
就是由于我們?cè)竿@些內(nèi)容,不論是在挪動(dòng)端照樣 PC 端,都是可以編纂的。只要隨時(shí)可編纂的可加工的內(nèi)容,才是屬于你的常識(shí)或許不雅點(diǎn)。
今朝看來,全部團(tuán)隊(duì)的投入長(zhǎng)短常值得的。張鵬告知我們,如今,「微軟小蜜」累計(jì)拜訪量曾經(jīng)跨越了 500 萬(wàn),并有累計(jì)跨越 100 萬(wàn)張圖片處置量和跨越 40 萬(wàn)份 PPT 制造量。
在這段時(shí)光,我們并沒有自動(dòng)去運(yùn)營(yíng)和推行,我們更多是存眷現(xiàn)有效戶數(shù)據(jù)和反應(yīng)。在用戶量面前,我們更存眷產(chǎn)物的焦點(diǎn)用戶,他們的需求能否被知足。
讓我們覺得愉快的是,我們看到小法式有許多忠誠(chéng)用戶。小蜜天天有跨越 70% 都是老用戶,也收到了他們?cè)S多好的建議,這對(duì)產(chǎn)物早期長(zhǎng)短常主要的。
在「微軟小蜜」面前,有微軟這些技巧支撐
作為一款以 OCR(即相似辨認(rèn)圖片中文字)功效為主的小法式,外面固然有微軟自家的技巧存在。
在采訪中,張鵬就向我們引見微軟在盤算機(jī)視覺范疇的研討結(jié)果。
微軟在研討盤算機(jī)視覺這個(gè)范疇照樣異常給力的,在我們前不久的盤算機(jī)視覺方面的年夜賽也得了許多一等獎(jiǎng),不論是可以或許辨認(rèn)出來的物體的品種,照樣坐標(biāo)值、地位等等,準(zhǔn)確率都異常高。
光有研討結(jié)果固然不可。若何在現(xiàn)實(shí)中,應(yīng)用好這些技巧結(jié)果,也是讓科技走進(jìn)千家萬(wàn)戶的主要步調(diào)。
將圖片、印刷品中的文字,釀成在電腦、手機(jī)上可編纂的文本,就須要用到 OCR 功效。
我們的產(chǎn)物絕對(duì)來說是屬于從技巧上比擬成熟,也比擬實(shí)用一些現(xiàn)實(shí)的場(chǎng)景,我們會(huì)慢慢經(jīng)由過程產(chǎn)物給年夜家分享。
好比,盤算機(jī)圖象辨認(rèn)要對(duì)圖象外面的根本特點(diǎn)值的抽取。例如,我們方才增長(zhǎng)了對(duì)圖象外面的物體辨認(rèn),打標(biāo)簽的功效,今朝可以辨認(rèn) 2000 多種物體,我們識(shí)圖接口在你的圖片里看到一種物體,就會(huì)標(biāo)注一種物體。
張鵬還引見,今朝微軟的光學(xué)問別技巧,可以辨認(rèn)來自全球跨商界、體育界、文娛界等跨越幾十萬(wàn)人的名人。
而「微軟小蜜」小法式,也是應(yīng)用了微軟盤算機(jī)視覺方面的研討結(jié)果,這也是盤算機(jī)視覺現(xiàn)實(shí)運(yùn)用的一個(gè)例子。
張鵬引見,盤算機(jī)視覺可以或許現(xiàn)實(shí)被運(yùn)用,離不開比來熱點(diǎn)的「深度進(jìn)修」。
深度進(jìn)修是機(jī)械進(jìn)修研討中的一個(gè)新的范疇,其念頭在于樹立、模仿人腦停止剖析進(jìn)修的神經(jīng)收集,它模擬人腦的機(jī)制來說明數(shù)據(jù),例如圖象,聲響和文本。深度神經(jīng)收集是按層排布的,每層都運(yùn)轉(zhuǎn)著分歧的數(shù)學(xué)運(yùn)算(算法)。
舉個(gè)例子,一個(gè)針對(duì)圖象辨認(rèn)的深度神經(jīng)收集,個(gè)中有一個(gè)層用于搜刮圖象中的一組特點(diǎn)(如:圖片的邊沿,外形等),前面的運(yùn)算層用于搜刮其他特點(diǎn),那末這個(gè)神經(jīng)收集的深度越深,他的進(jìn)修才能越強(qiáng),對(duì)圖片的表達(dá)越清楚和智能。
深度進(jìn)修道理圖
微軟在深度進(jìn)修范疇的研討,也有異常好的結(jié)果。
今朝典范的神經(jīng)收集設(shè)計(jì)普通包括 6~7 層,部門可以到達(dá) 20 到 30 層,而微軟亞洲研討院一種被稱為「深度殘差收集」(deep residual network)的新技巧,可以停止多達(dá) 152 層的龐雜數(shù)學(xué)運(yùn)算。
這意味著,在不遠(yuǎn)的未來,微軟可使用 GPU 和其他公用芯片的宏大集群,晉升人工智能的林林總總辦事才能,個(gè)中就包含明天引見的「微軟小蜜」小法式。
將來,微軟還盤算如許做小法式
在采訪中,張鵬也向我們泄漏,他們團(tuán)隊(duì)接上去的籌劃。重要之事,就是為小蜜增長(zhǎng)新功效。
小蜜有一雙眼睛,他如今可以看懂圖片中的文字和表格,下一步我們會(huì)讓他看到更多的器械,好比流程圖,信息圖表,圖標(biāo)等等。
除「看見」,我們還愿望小蜜能「聽到」,即用戶可以直接經(jīng)由過程天然說話讓小蜜發(fā)生內(nèi)容。最初,我們?cè)竿∶劭梢匀ピO(shè)計(jì),用戶只需關(guān)懷內(nèi)容輸出便可以了,將演示后果交給小蜜來完成。
我們前一段時(shí)光為「微軟小蜜」小法式增長(zhǎng)了表格辨認(rèn)功效,你用手機(jī)攝影一張表格圖片,我們可以辨認(rèn)圖片中的表格坐標(biāo),在 PPT 中將表格復(fù)原出來,你可以很輕松的對(duì)表格停止各類操作。從辨認(rèn)后果上,我以為在市場(chǎng)上照樣搶先的。
固然,這個(gè)小法式還有許多要改良的處所,如適才提到的,若何更好的將微軟在盤算機(jī)視覺和深度進(jìn)修范疇的研討產(chǎn)物化,我們還有一段路要走。
當(dāng)被問及能否還有其他小法式推出,張鵬的答復(fù)是「固然」,并且偏向也是以臨盆力為主。然后對(duì)我們賣了個(gè)關(guān)子,「這里先不泄漏太多,愿望早點(diǎn)兒和用戶會(huì)晤。」
我們也等待「微軟小蜜」和微軟 Office 365 團(tuán)隊(duì),可以或許用新技巧,贊助我們更快、更好地完成任務(wù)。