漫談人工智能工具

巴黎鐵塔夜景(AI生成)

這幾年一直在用人工智能工具,不少是完全免費,也有給一次性或是每天每月免費額度,部份甚至可以累計額度。反正再用,也應該會一直用下去,筆者打算寫一篇分享相關經驗,鏈接等等,以供參考,也鼓勵讀者多嘗試使用,提高生產效率。

當然,筆者支持利用人工智能工具賺錢,應該使用付費版本,畢竟人家訓練模型的成本費用都在。不然,它們開發研究撐不下去,那以後可能便沒有好的免費試用。

谷歌的Veo

最近剛開始使用Veo,那麽便先説説Veo。

其實谷歌數年前便推出了免費可用的人工智能文生圖工具,位於AI Test Kitchen (人工智能試驗厨房)。

當時文生圖的功能并不完備,出圖也是沒能緊貼指令行事。

後來變成了Image FX,還加上了Music FX,能生成聲音。不説音樂是因爲成品還不太像我們常聽到的音樂。再後來又有了Music FX DJ,實時生成音樂。

筆者加入了生成視頻模型的等候名單,一等就是一年,差不多就忘了。然後發現Google Labs多了一個Whisk。這個Whisk,原來就是人工智能視頻工具。筆者以爲會有Video FX,結果等來沒有了一直在用的FX尾綴的Whisk.

試用體驗

一試之下,速度還是挺快的,大概三十秒吧,視頻出來了,很適合筆者這類沒有太多耐心的人;

生成的視頻還蠻流暢,可能由於跟其他工具相比,畫質比較低。視頻的畫質是高清(720p),沒有4K 超高清,免費的不能太苛求。

生成的動作,頗爲真實,感覺比市面很多工具要好不少。這是一個短期試驗的觀察,并不全面。讀者可以在這裏看看其中一個視頻的生成效果;那個切東西的動作做的不錯。

Whisk 還可以生圖,用以配合生成視頻。

美中不足之處,是不能把指定的圖轉爲視頻。工具容許上傳圖片,但只會當作角色,背景和風格配合提示詞參考。

哪裏找?

網上搜Google Whisk,很容易找到網頁鏈接。真的找不到,歡迎評論區留言。

微軟的Bing Video Generator

這幾天稍微試用了Bing Video Generator。

微軟的Bing Video Generator暫時只有手機程式,沒有電腦網頁版本。只能在手機使用。

它其實就是Bing App裏頭的一個小程序。

現在的Bing App既能生圖,也能生視頻。

生成圖片用的是DALL.E 模型。

而視頻模型則是Sora。

需要注冊微軟的賬戶才能生成圖片和視頻。

試用體驗

生成的圖片看不出來有甚麽特別之處,比起其他的大厰出品可謂不過不失。

筆者看到自己擁有十五個金幣,一次生成四張圖片便會消耗掉一個。

現在還不知道金幣是一次性還是每天/每月發。多試用幾天便有分曉。

生成視頻卻沒有用掉一個金幣,這是代表可以無限生成?

不過,選標準速度,那個生成是挺慢的。

一天也出不來多少個視頻,無限也就沒甚麽意思。

功能也不多,就是一個簡單的輸入提示詞,然後按生成,筆者看不到有圖生視頻的功能,只能以文字生成,那視頻内容不容易把控。

視頻長度為5秒。

這是分享短期試用的一點經驗和觀察。

預告

筆者會繼續努力分享更多使用人工智能工具的體驗。

這篇貼文預計會很長,所以筆者計劃逐步更新。有空來看看,留言支持提醒筆者更新。

感謝閲讀。


Comments

Leave a Reply

Your email address will not be published. Required fields are marked *