中國移動自主開發(fā)大賽10強 | 智能圖像轉(zhuǎn)換神器“悟空”誕生記

我們的團隊

悟空團隊由重慶公司12582基地的5名有激情有夢想的程序員小伙伴組成

產(chǎn)品經(jīng)理、架構(gòu)師曹旭:哈爾濱工業(yè)大學計算機專業(yè)碩士,負責算法研究、整體架構(gòu)設(shè)計等

算法工程師周波:重慶大學計算機專業(yè)碩士,負責樣本數(shù)據(jù)處理、模型訓練

后端開發(fā)工程師袁文樹:中國人民大學計算機專業(yè)學士,負責后端代碼編寫

前端開發(fā)工程師邱凱:重慶郵電大學計算機智能科學與技術(shù)學士,負責前端代碼編寫

測試工程師王鋒:重慶郵電大學信號與信息處理專業(yè)碩士,負責UI設(shè)計、產(chǎn)品功能測試

一、創(chuàng)意與機遇的碰撞

為貫徹落實黨的十九大精神和國家“大眾創(chuàng)業(yè)、萬眾創(chuàng)新”工作要求,持續(xù)推動公司轉(zhuǎn)型,實現(xiàn)全員創(chuàng)新常態(tài)化,中國移動集團公司、集團工會決定舉辦“中國移動2018 年(第四屆)自主開發(fā)大賽”,本屆大賽圍繞公司“大連接”戰(zhàn)略,以“人工智能”為主題,面向內(nèi)部員工自主開發(fā)產(chǎn)品。

恰逢此時,一個小伙伴想把長輩老照片修復,卻又找不到一款對口應(yīng)用的感慨也在閑聊中產(chǎn)生,于是小伙伴們一拍即合,迅速組建了團隊,創(chuàng)意與機遇的巧合碰撞,于是抱著值得一試的態(tài)度,第一代悟空便由此誕生了。

二、悟空誕生記

最開始的悟空,被定義為一個修復老照片的利器,專門針對性的修復陳舊老照片的各種問題。隨著悟空的迭代,試用悟空后,對悟空提出功能需求的小伙伴也越來越多,UI小伙伴希望悟空是一個快速轉(zhuǎn)化色彩風格的利器,能為具有重復性的UI圖設(shè)計工作節(jié)省大量設(shè)計時間;運營小伙伴希望悟空是一個生成自定義風格圖片的利器,能快速生成運營活動宣傳圖,提升活動效率和活動轉(zhuǎn)化率。

最終,悟空被定義為一個面向普通大眾人群、專業(yè)圖像處理人員(如UI設(shè)計師,互聯(lián)網(wǎng)產(chǎn)品運營人員等)的圖像智能轉(zhuǎn)換產(chǎn)品,提供老照片修復、圖片去抖動、風格速換等功能,可滿足大眾人群的各種圖像處理需求,并提升專業(yè)圖像處理人員UI設(shè)計效率。

悟空的主體功能開發(fā)至今歷時10個月,1月完成產(chǎn)品設(shè)計,2月完成WEB版開發(fā),3月完成第一個模型訓練,7月完成小程序開發(fā),8月演進了模型,10月與和家親達成了合作意向,為和家相冊提供照片處理能力,預(yù)計2018年底將形成完整功能的開放能力,提供給各個產(chǎn)品使用。

三、智能圖像轉(zhuǎn)換產(chǎn)品

悟空專業(yè)

利用人工智能深度學習技術(shù),采用了斯坦福大學的論文《基于感知損失函數(shù)的實時風格轉(zhuǎn)換和超分辨率重建》《Perceptual Losses for Real-Time Style Transferand Super-Resolution》中提供的算法。針對不同模型的訓練采用了不同的數(shù)據(jù)集,包括gopro、div2k、coco等開源數(shù)據(jù)集?;赥ensorflow平臺,采用Python語言實現(xiàn)圖像處理算法;基于JAVA語言,采用SpringMVC+Jsp實現(xiàn)后臺及WEB界面開發(fā)。

悟空便捷

要進行圖像轉(zhuǎn)換,您只需:上傳照片,選擇場景,等待收貨,即可。悟空全程智能計算,無需任何額外人工操作。

1、功能簡介

悟空目前提供三大圖像轉(zhuǎn)換場景,分別是:

老照片修復:提供圖像殘缺修補、上色翻新、無失真放大功能,解決老照片部分缺失、泛黃褪色、不可放大等問題。

圖片去抖動:在20s內(nèi)實現(xiàn)對植物、人物等各種場景的模糊圖片清晰化處理。

風格速換:面向大眾人群和專業(yè)人群,提供一鍵換色,一鍵換風服務(wù)。

一鍵換色從用戶上傳的自定義圖片中提取色彩特征,疊加到原始圖片中,從而生成帶有原始圖片元素和自定義圖片色彩特征的新圖片,真正實現(xiàn)色彩隨心變。

一鍵換風功能提供了多種預(yù)定義的風格模型,用戶上傳原始圖片,選擇風格模型,即可實現(xiàn)將模型里的風格特征疊加到原始圖片上,生成新的個性風格圖片。

2、使用場景

1)普通大眾群體使用場景

中國60歲以上的老年人口數(shù)量達2.41億,這個群體年輕時的黑白照片,洗印在老舊的相紙上,如今普遍褪色泛黃、部分缺失,需解決殘缺、泛黃,無法放大的問題。

8、90年代的傻瓜相機無防抖功能,拍攝照片普遍模糊,需將抖動模糊的照片變清晰。

2)專業(yè)人群的使用場景

UI設(shè)計圖風格快速轉(zhuǎn)換

在春節(jié)、元宵、清明等傳統(tǒng)節(jié)假日時,各類互聯(lián)網(wǎng)產(chǎn)品均開展節(jié)假日線上營銷,APP首頁banner圖、廣告宣傳圖、活動引導圖、活動詳情頁面等均需要帶有節(jié)假日要素,針對電商類互聯(lián)網(wǎng)產(chǎn)品、商品圖也會打上節(jié)日風格標簽,往往需要在短時間設(shè)計大量風格一致的設(shè)計圖,設(shè)計師可將簡單設(shè)計的原始圖(包含內(nèi)容要素,針對電商平臺銷售的商品可以直接用手機拍攝一張清晰地照片)上傳本平臺,選擇對應(yīng)的節(jié)假日風格,幾分鐘便可快速生成最終效果圖。

待設(shè)計圖+設(shè)計風格圖

通過平臺自動生成的設(shè)計圖

特定場景的圖片樣式設(shè)計

針對夜景、動漫、抽象等風格的設(shè)計往往比傳統(tǒng)節(jié)假日UI的設(shè)計更加困難,UI設(shè)計師需要在原始圖片的基礎(chǔ)上進行更復雜的色彩的處理,需要的設(shè)計時間更久、對設(shè)計師的水平要求更高。本平臺可以基于曾經(jīng)設(shè)計過的夜景、動漫、抽象等風格的圖片(對于夜景等真實場景,可直接拍攝一張高清的效果較好的照片)進行模型訓練,生成對應(yīng)特定場景的模型,UI設(shè)計師可通過平臺上傳一張待設(shè)計圖片、經(jīng)過簡單的選擇對應(yīng)場景,即可快速生成UI設(shè)計圖。

待設(shè)計圖+設(shè)計風格圖

通過平臺自動生成的設(shè)計圖

3)其他場景

平臺可逐漸沉淀各種各樣的場景模型,豐富可轉(zhuǎn)換的場景能力,最終作為能力提供API接口對外開放,如某款A(yù)PP調(diào)用該接口能力可實現(xiàn)根據(jù)用戶偏好自動轉(zhuǎn)換頁面風格、自動換膚等,用戶體驗更好。

四、悟空的未來 值得期待

為了便于推廣,我們放棄了推出新APP的想法,轉(zhuǎn)而專注于提供開放的SDK、restAPI等能力,為中移動各APP、WEB類產(chǎn)品提供圖像轉(zhuǎn)換服務(wù),拓展產(chǎn)品的功能,助力各產(chǎn)品在競爭中脫穎而出。

如果你是一個產(chǎn)品團隊,你可以使用悟空的開放能力,如果你是對圖片處理有需求的人員,你可以使用悟空提供的WEB版或是小程序。

半決賽現(xiàn)場

悟空是當下人工智能時代,對極致高效理念的一次踐行貫徹,我們希望悟空能成長為一個智能圖像處理的專家,為中移動在圖像處理領(lǐng)域AI能力的提升做出卓越的貢獻。

免責聲明:本網(wǎng)站內(nèi)容主要來自原創(chuàng)、合作伙伴供稿和第三方自媒體作者投稿,凡在本網(wǎng)站出現(xiàn)的信息,均僅供參考。本網(wǎng)站將盡力確保所提供信息的準確性及可靠性,但不保證有關(guān)資料的準確性及可靠性,讀者在使用前請進一步核實,并對任何自主決定的行為負責。本網(wǎng)站對有關(guān)資料所引致的錯誤、不確或遺漏,概不負任何法律責任。任何單位或個人認為本網(wǎng)站中的網(wǎng)頁或鏈接內(nèi)容可能涉嫌侵犯其知識產(chǎn)權(quán)或存在不實內(nèi)容時,應(yīng)及時向本網(wǎng)站提出書面權(quán)利通知或不實情況說明,并提供身份證明、權(quán)屬證明及詳細侵權(quán)或不實情況證明。本網(wǎng)站在收到上述法律文件后,將會依法盡快聯(lián)系相關(guān)文章源頭核實,溝通刪除相關(guān)內(nèi)容或斷開相關(guān)鏈接。

2018-10-19
中國移動自主開發(fā)大賽10強 | 智能圖像轉(zhuǎn)換神器“悟空”誕生記
中國移動自主開發(fā)大賽10強 | 智能圖像轉(zhuǎn)換神器“悟空”誕生記,我們的團隊悟空團隊由重慶公司12582基地的5名有激情有夢想的程序員小伙伴組成產(chǎn)品經(jīng)理、架構(gòu)師曹旭:

長按掃碼 閱讀全文