3月5日,兩位華人創(chuàng)業(yè)者苗亦舒和王子宇建立的 AI 初創(chuàng)公司推出了搭載自研 AI 模型的視頻生成工具 Haiper。
題圖來源:Haiper
Haiper 的兩位創(chuàng)始人都獲得了牛津大學機器學習方向的博士學位,在該領域擁有豐富的知識和實踐經驗。苗亦舒曾供職于 TikTok,王子宇則在谷歌和 DeepMind 擔任過研究員。
Haiper 于2022年正式成立,一開始的方向是 AI3D 建模。而根據創(chuàng)始人的說法,團隊在半年前決定將創(chuàng)業(yè)方向改為 AI 視頻生成,半年時間,他們推出了 Haiper 的測試版。
目前,Haiper 已經完成了兩輪融資,總融資額達到1920萬美金。最近的一輪融資額為1380萬美元,由 Octopus Ventures 領投,5Y Capital 跟投。
完全免費的視頻生成工具
與其他視頻生成產品采用訂閱付費模式不同,Haiper 目前完全免費,用戶只需訪問 Haiper 官網就可以使用。
但是,目前 Haiper 只能生成最長2秒的高清視頻,和最長4秒的標清視頻。目前 Pika、runway、Stable Video 等主流產品直接生成的視頻最長4秒,可擴展到16秒,但 Sora 則能生成最長60秒的視頻,但目前只有 Demo。
除了視頻生成功能外,Haiper 還提供視頻卡通化、照片卡通化、重繪視頻等功能,未來還將引入擴展視頻功能。
對于付費問題,創(chuàng)始人苗亦舒表示,目前 Haiper 的視頻生成功能還不太成熟,實行付費訂閱模式還“為時尚早”,公司的計劃是,保持免費模式,并專注于建立社區(qū)生態(tài)。而在 ToB 方面,Haiper 已經與京東等企業(yè)合作,對商業(yè)場景進行探索。
最終目標,構建通用AI模型
目前,Haiper 專注在面向 C 端用戶的網站視頻生成產品,但創(chuàng)始人透露,他們希望開發(fā)一個使用場景更廣泛的視頻生成模型。公司已經私下聯(lián)系了一些開發(fā)者來測試 Haiper 的 API,并根據開發(fā)者的反饋來優(yōu)化 AI 模型。此外,Haiper 還考慮將其模型開源,讓更多的用戶來優(yōu)化模型,探索更豐富的使用場景。
對于下一階段的目標,Haiper 團隊表示,目前 AI 視頻生成正在達到一個拐點,模型需要提高質量和準確性,以解決恐怖谷問題。
恐怖谷(Uncanny Valley)是指當人們看到人工智能
生成的擬真性較高的人物形象時,會產生厭惡的感覺
這要求模型不僅要理解大量視頻和圖像形式的訓練素材,還要理解現(xiàn)實世界的物理規(guī)律和其中的信息交互方式,例如光線、運動、紋理和不同對象之間的交互。例如,AI 需要了解雨滴撞擊物體表面時會如何飛濺,或者風吹過人臉時頭發(fā)如何移動。這也是目前 Haiper 技術攻關的重點方向。
而未來,創(chuàng)始人苗亦舒表示,Haiper 的目標是建立一個具有完整感知能力的通用 AI 模型,而當前開發(fā)的視覺基礎模型將使 AI 能夠深入理解世界,并在生成的視頻中更好地復制現(xiàn)實世界,為通用模型打下基礎。
雖然理想很美好,但經過去年一整年的發(fā)展,AI 視頻生成賽道其實也變得非常擁擠。OpenAI 的 Sora 在技術上一騎絕塵,已經融資超過2.3億美金的 Runway 已經擁有了不少用戶,占據了先手。此外,谷歌、Meta、Stability AI 等一眾明星企業(yè)也都推出了自己的視頻生成模型。Haiper 作為一款新產品想要切入市場,并在未來實現(xiàn)商業(yè)化,其實并不容易。
但是根據 a16z 的評論文章,目前人工智能視頻工具大概只達到了類似當時 GPT-2的發(fā)展水平。也就是說,目前 AI 視頻工具已經在技術上有所突破,但仍缺乏適用于普通用戶的應用場景。
而如果 Haiper 能在視頻擬真技術上有所突破,真正找到能夠落地的應用場景,實現(xiàn)差異化。那么切入市場,甚至超越 Sora 等其他同類產品,也并非不可能。
榜單收錄、高管收錄、融資收錄、活動收錄可發(fā)送郵件至news#citmt.cn(把#換成@)。
海報生成中...