「這些應用讓AI觸手可及」
(資料圖片僅供參考)
記者 | 何昕曄
編輯 | 王杰夫
Key Points
妙鴨相機成為生成式AI在國內(nèi)的首款現(xiàn)象級應用;
妙鴨并非來自創(chuàng)業(yè)團隊,而是由阿里優(yōu)酷內(nèi)部孵化;
妙鴨底層技術是搭配了LoRA插件的Stable Diffusion開源模型,你在電腦上也能實現(xiàn);
妙鴨已經(jīng)上線蘋果應用商店,并時刻準備從9.9元漲價到29.9元。
終于,在ChatGPT引發(fā)的生成式AI熱潮過去半年后,國內(nèi)用戶總算可以通過「妙鴨相機」(以下簡稱「妙鴨」)這款照相應用,切切實實地感受下這撥浪潮的溫度。
7月17日,這款AI人像生成應用在微信小程序上線。當你上傳21張符合標準的個人照片并支付9.9元后,妙鴨便會為你生成一個「數(shù)字分身」——其實就是一張你的二維頭像;接下來,像在影樓一樣,你可以選擇各種風格的裝扮,正裝、校園、古風等等,程序會自動將你的頭像與裝扮結合起來,生出一張張數(shù)字影樓照。
妙鴨相機生成的數(shù)字寫真
妙鴨相機一經(jīng)上線便引發(fā)了用戶極大的試用熱情,畢竟誰沒有在朋友圈曬過幾張裝扮夸張、姿勢做作的寫真呢,更何況你的數(shù)字分身還挺養(yǎng)眼。
妙鴨相機從6月30日開始邀請制內(nèi)測,當時就有上千人參與。正式上線小程序后,高峰期排隊人數(shù)超過4000人,也在社交媒體平臺上引發(fā)了新一輪的「曬自拍」熱潮。
7月30日,妙鴨相機上線蘋果應用商店,小程序版本生成的數(shù)字分身可以直接遷移過來,但無法再生成新的數(shù)字分身。
妙鴨背后的技術并非獨一無二
妙鴨的團隊并未對外公開其圖像生成模型的底層技術,只是為這個模型挑選了個好名字——「提香」(Tiziano),他是文藝復興時期的重要畫家,尤其擅長色彩鮮艷的肖像畫。
但同樣是AI創(chuàng)業(yè)者的王凱告訴《新皮層》,妙鴨相機實際用到的技術并不復雜,應該是搭配了LoRA插件的Stable Diffusion開源模型。王凱是一位連續(xù)創(chuàng)業(yè)者,擔任過日事清運營負責人,最近創(chuàng)立VentureAI,提供圖像生成應用Midjourney API服務。
Stable Diffusion模型是Stability AI公司推出的在行業(yè)內(nèi)使用最廣泛的開源圖像生成模型,而LoRA是對這種大模型的微調方法。LoRA全稱是Low-Rank Adaptation of Large Language Models,最早在2021年由微軟的研究人員提出。它只需很少的數(shù)據(jù),就可以訓練出具有特定風格或特征的模型。
具體實現(xiàn)方式是,利用低秩適配(low-rankadaptation)技術,只訓練新加入的數(shù)據(jù)(比如用戶上傳的21張照片),之后將由此形成的新參數(shù)和已有模型合并。這樣的好處在于,服務提供者(比如妙鴨)不必耗費大量算力重新訓練模型,只需要用戶提交的少量數(shù)據(jù)(即21張照片)就能夠生成特定風格的圖像。這就是妙鴨相機只用到了21張照片,就能為不同用戶生成個性化數(shù)字分身的原因。
其實,在妙鴨相機出圈前,已經(jīng)有不少用戶嘗試用LoRA技術生成數(shù)字分身。例如在小紅書或嗶哩嗶哩上,搜索「LoRA定制自己的形象方法」就能發(fā)現(xiàn),早在半年前,就己經(jīng)有AI愛好者推出手把手的視頻教程。
B站與小紅書上早就有大量LoRA使用教程
而從妙鴨目前實現(xiàn)的效果來看,團隊并沒有對LoRA技術做進一步優(yōu)化。理論上,如果用龐大的人臉數(shù)據(jù)庫訓練一個基于Diffusion Model的垂直模型,妙鴨能實現(xiàn)更好的數(shù)字分身效果?!傅@樣處理需要高昂的算力成本?!雇鮿P說,「以妙鴨現(xiàn)在的數(shù)據(jù)看,很難下決心投入做這件事。」
妙鴨出圈其實是產(chǎn)品的勝利
其實,妙鴨并非是一支創(chuàng)業(yè)團隊。從用動物給產(chǎn)品起名的習慣看,不難猜出它來自阿里巴巴。
公開資料顯示,妙鴨相機的主體公司是未序網(wǎng)絡科技(上海)有限公司,法定代表人為張龍同時擔任優(yōu)酷視頻(西安)傳媒科技有限公司的法定代表人、執(zhí)行董事兼總經(jīng)理,其監(jiān)事馮云樂也同時擔任了多家阿里系公司的監(jiān)事職務。所以,妙鴨相機其實是優(yōu)酷的內(nèi)部創(chuàng)業(yè)項目。
妙鴨的出圈,背后并沒有創(chuàng)新性的技術,主要還是基于用戶洞察的產(chǎn)品創(chuàng)新。妙鴨相機創(chuàng)始人張月光是互聯(lián)網(wǎng)圈內(nèi)一位資深產(chǎn)品經(jīng)理,曾在今日頭條與阿里巴巴工作,負責過今日頭條紅包雨、字節(jié)時光相機、支付寶「集五?!沟戎a(chǎn)品策劃。通過此次妙鴨的爆紅,也能看出他老辣的產(chǎn)品經(jīng)驗。
一是價格便宜。9.9元,一杯奶茶的價格,降低了用戶的付費門檻。早在今年5月,美圖秀秀推出的同類產(chǎn)品「美顏相機」App就上線了「AI寫真」功能,價格也是9.9元,但只能獲得一張同風格、同姿勢的照片,并沒有太多用戶付費試用。目前,美顏相機已經(jīng)調低了價格,從9.9元降到了3.9元。出圈后,妙鴨相機則反過來提升了價格。小程序頁面顯示,妙鴨目前提供的服務的標準價是29.9元——9.9元是限時特惠價格。王凱稱,妙鴨9.9的定價肯定是在虧錢的,國內(nèi)AIGC類的應用想在C端出圈,低價是決定性的因素。
二是嘗試零門檻。妙鴨相機初期搭載在微信小程序之中,不需要下載App即可體驗,降低了試用成本。此外,用戶只需上傳照片并選擇想要的風格,將輸入Prompts提示詞的過程隱藏在了產(chǎn)品背后,降低了用戶對于陌生技術的緊張感。
三是產(chǎn)品有傳播屬性。相比于文字內(nèi)容,自拍類圖像自帶社交屬性,可以滿足自我形象展示的需求,用戶有更強的動機在社交媒體上傳播這類內(nèi)容。妙鴨還推出了分享鼓勵機制,通過朋友圈分享邀請好友,就可以獲得更多鉆石,這也加速了用戶的自發(fā)傳播。
四是痛點捕捉準確?!笓碛幸惶赘咂焚|的寫真需要多少錢?699?1299?3699?除了金錢,拍寫真又需要多少步?定檔期、化妝、造型、拍攝、選圖、修圖、交片……不僅如此,很多女生在約拍時,還可能會遇到騙子,錢財甚至安全都得不到保障?!挂陨鲜敲铠喒俜綄τ谟脩敉袋c的介紹,團隊精準地捕捉到了拍寫真對于大多數(shù)消費者來說,是一項在金錢和時間方面都有很高成本的活動,消費者希望能更便宜、更便捷地得到拍寫真的體驗。
妙鴨對天真藍會是「降維打擊」么?
無需妝造,僅需上傳已有的個人照片,就能收獲不同風格的寫真。妙鴨相機推出的功能引發(fā)了討論,天真藍和海馬體這類線下照相館,還有存在的必要嗎?
妙鴨相機的確想要做目前海馬體們正在做的事。從官方公布的信息來看,團隊對妙鴨相機的定位是「每個人的AI攝影師」,希望可以幫助用戶「便宜、快捷、安全地追求美」。而社交媒體上的曬圖熱情也體現(xiàn)了大眾對妙鴨生成效果的肯定?!副砬樽匀弧埂赶褡约河直茸约好酪稽c」是常見的對其的評價。
但是,有很多用戶表示,妙鴨相機的生成效果并不穩(wěn)定,只有幾個模版生成的圖像是「能看得過去的」,而很多模版生成的照片完全不像本人,「有的很像,有的似像非像,有些瘆得慌」,這是試用者小潔的評價。有些試用者甚至反饋在生成的所有照片中,找不到一張像自己的,「從數(shù)字分身環(huán)節(jié)開始生成的就是另一個人」。此外,雙眼皮弧度不太流暢、手部細節(jié)粗糙是用戶普遍反應存在的問題。
目前妙鴨相機的小程序評分是2.4分(滿分5分),在近3000條評價中,可以看到多條「照片失真」的評價。
不過,天真藍和海馬體的寫真照就足夠「寫真」么?
其實去過這兩家照相館拍照的人在拿到他們的照片后,也常有這樣的疑惑,好看是好看,但這像我嗎?和AI生成的照片一樣,在線下拍照,成片失真的情況也非常普遍,還有人拿到的照片在辦簽證、考試報名等環(huán)節(jié)根本無法通過。
一位客戶在海馬體照相館門店觀看產(chǎn)品介紹
其實,線下照相館也早已用上了AI技術。早在2019年,天真藍的創(chuàng)始人周揚就表示過,天真藍的競爭力在于AI人臉識別修圖技術,能實現(xiàn)1分鐘修圖,97% 替代人工,并保證100%通過人臉識別的標準化運作,天真藍將這套系統(tǒng)稱為「AI修圖中央廚房」。所以,在這些照相館獲得的照片,也不是個性化的——AI提供了標準化、模版化的流水線作業(yè),這正是照片同質化、失真的原因。
所以,AI生成器有的問題,線下照相館也少不了。王凱說,妙鴨相機目前的技術水平要代替線下照相館還有一段距離,但圖像生成的技術一直在發(fā)展進步,未來是很有可能的。比如,如果AI技術可以幫助用戶生成在公安系統(tǒng)可以過審的證件照,那會是一個非常大的進步。
妙鴨還能火多久?
目前,妙鴨主要針對拍寫真等場景,但對于大多數(shù)消費者,這并不是高頻的、需要經(jīng)常復購的需求。用戶愿意為此類產(chǎn)品付費,主要還是因為新鮮,但再次付費的意愿沒有保證。
在妙鴨出現(xiàn)之前,去年底國外就有過同類的圖像生成應用Lensa,也是基于Stable Diffusion模型,是同類應用中的開創(chuàng)者。Lensa去年11月底推出「魔法頭像」功能,用戶上傳10到20張個人照片,Lensa 就可以生成各類AI自畫像或頭像。12月,Lensa登頂 App Store「照片和視頻」分類下載榜單榜首。
Lensa按次付費的收費標準是,生成50個頭像3.99美元、100個頭像5.99美元、200個頭像7.99美元。此外,Lensa還推出了訂閱制的模式。
去年12月,Lensa的下載量突破1700萬次,單月收入就達800萬美元。但是,這撥熱度很快沉寂,到今年1月,其下載量跌至不足200萬。
圖片來源:Sensor Tower《2023年AI應用市場洞察》
所以,從Lensa的先例來看,這類產(chǎn)品在用戶留存方面很難持續(xù)。王凱分析,妙鴨相機之所以定價9.9元更多是因為應用處于測試期,如果想保障產(chǎn)品受歡迎就不能定價太高,所以虧錢降低使用門檻,當然能否讓用戶長期使用是非常大的挑戰(zhàn)。
目前,妙鴨采取的留存用戶的方式是不斷開發(fā)出新的模版。最近一周,妙鴨上新了多款國風系列模版。7月29日,趁著電影《芭比》的熱度,妙鴨還上線了美式芭比風和Y2K風格的模版。
妙鴨相機新推出的兩款造型風格
王凱認為,在AI圖像生成的市場中,很多賬都已經(jīng)被算得很清楚了,「比如,能生成在線下場景可用的證件照,能加 10 億的市場;能生成游戲圖,能加1萬億的市場;能生成商業(yè)海報,能多幾千億的利潤」。所以,妙鴨相機這種并沒有技術創(chuàng)新的應用,對市場的影響甚微。
「Lensa作為一個開創(chuàng)性的應用在國外推出的時候,能為市場在圖形生成的應用層帶來啟發(fā),所以能帶動一撥商業(yè)行為。但妙鴨這樣的后來者,其實對當下全社會關注、投資大模型沒什么影響,大家都能看到大模型帶來的巨大變革?!雇鮿P說。
不過,妙鴨的走紅證明了,當下的國內(nèi)市場,或許并不缺乏先進的技術,要知道最近發(fā)布的每款國產(chǎn)開源模型都號稱在基準測試中勝過美國競品;缺少的反而是對用戶需求的精準洞察和將生成式AI落地成產(chǎn)品以滿足這個需求的能力。
在移動互聯(lián)網(wǎng)浪潮初期,正是依靠這種能力才誕生了微信、抖音、美團、小紅書這些現(xiàn)象級應用;在生成式AI浪潮下,我們期待下一款「妙鴨」。
-END-
本文版權歸第一財經(jīng)所有,
未經(jīng)許可不得轉載或翻譯。
2023年金字招牌大調查已經(jīng)啟動啦,
關鍵詞: