2023-06-29

AIについて思うこと

AIの進化はものすごいスピードで、文章も画像も音楽も、膨大な情報を元に簡単に生成することができるようになった。

新しいツールがたくさん出てきて、情報を得るにも使ってみるにもどう業務に生かすか考えるにも追いついてない。今たくさん出てきたツールはもう少しすれば淘汰されて消えていくものも多いだろうし、学習コストだけかかるような気がしているのでちょっと様子見している。

現状AIで何かを生成するというと、「表層的な意味を伝える画像をアウトプットする」というような使い方を想像することが多いのでは。テキストのプロンプトから画像を出力するような。

たとえば、ちょっと前に見かけたこの広告とか。

電車で見かけた広告、よく見たらAI生成!?　「人間じゃないのか」「今後増えそう」　ユニークな広告を制作した東急に意図を聞いた

写真の下部にある「『街をハックする仕事』を掲げ、やりがいある仕事にあふれる職場URBANHACKSで、楽しく働く2人のエンジニア」という文章。一見すると写真のキャプションに見えますが、よく見るとその前には「prompt」の文字があります。実はこの文章、画像生成時に入力されたであろうAIへの指示

電車で見かけた広告、よく見たらAI生成!?　「人間じゃないのか」「今後増えそう」　ユニークな広告を制作した東急に意図を聞いた - ねとらぼ

一部抽象的だが具体的な「2人」「エンジニア」の要素があるため、大きく外れずにイメージを作ることができている。AI生成のプロセスをコンセプトとする制作といえる。

Google、テキストから音楽を作れる音楽生成AIツール「MusicLM」試用版を公開

Googleは音楽生成AIツールの試用版を公開したけど権利関係の部分はまだ懸念があるよう。

自分で実際AIツールを触ってみて

AI関連のセミナーのアイキャッチを制作する際にStable Diffusionを使ってみた。かなり抽象的な文章をDeepLで翻訳してプロンプトをつくった。
いくつか出力されたもののうち、「展開可能かどうか」を軸に選んで制作に生かした。何回かに分けて公開されるイベントレポートのアイキャッチをシリーズ的に作る必要があったので、AI生成ツールで出力したベースのビジュアルを切り出して素材とし数点制作した。今回は時間の関係で断念したけど、そのビジュアルをベースにイベント開始前や懇親会中の幾何学待機モーショングラフィックス的なものの制作も妄想していた。

(こういうのつくってみたいなーと思ってる。CMCMしてないモーション制作の貴重な場のひとつ。)

AI生成画像を使用する際のクレジット表記についての部分が曖昧だったので、調べるのに工数がかかった。(こういうの苦手)

あとはAfterEffectsのエクスプレッションをChatGPTに聞いて、回数とか秒数とか任意の部分は調整してテストした。「こういうのができるんだな〜」と理解はしたが、実際案件で使える機会はなかった。

聞いたら教えてくれた単純にふわふわするブラウザ pic.twitter.com/FZ32RD9oPI
— _ (@r_emats) March 9, 2023

動画の構成とナレーションについては欲しい感じの結果が得られなくて自分で考えた方が早い、となって諦めた。精度の高い出力のためのプロンプトを考えるほうが時間かかる。プロンプト作成スキルも今後重要になってくるとは言うが。毎回条件は違うからフォーマット化できるわけでも無いと判断した。動画制作は、構成を考えるところにも面白さがある(自分の頭で考えたい)と思ってるんだな、と気づきもした。

自分が制作する側でAIを活用するとしたら

AIが生成した画像というアウトプットを使うのではなくて、あくまで制作プロセスの一部で使えるところがあったら使いたい。

たとえば、AIベクターデータ化ツールは使うイメージがわいた。

Trace Pixels To Vectors in Full Color, Fully Automatically, Using AI - Vectorizer.AI

写真や、手で描いた絵をベクターデータ化して、SVG素材として「WEB上で劣化なく表示させる」とか「AfterEffectsに取り込んでモーションをつけてアニメーションを作る」とかが容易にできるようになるなぁと思った。
最終アウトプットの前の仕込み手順・時間を短縮できる。調理前の下ごしらえで使えるイメージ。短縮できたら、別の工程に手間と時間をかけることができて、結果クオリティの向上につながるはず。

AfterEffectsのエクスプレッションについても、まだ実務に生かせてないけど勉強に使えると思う。まずやりたいこととAIで出力されたものから、コードを読み解いて理解する。コードを理解する→やりたいことを実現するの順だとハードルが高いと思っていた。プロンプトと実装したもののギャラリーをつくれたらいいかも。(もうある？いや、自分でつくることに意味がある)

あとAdobeソフトに搭載されてるAIテクノロジーについてはすでに享受してた。画像中の不要なものを取り除く作業なんてもう一瞬だもんな。

表現ってなんなの

“こういうプロンプトでこんなに精度の高い美しい可愛い画像が出力できた！”ということに対しては「へー」って感じであまり関心が持てない。現実にはあり得ないものとか架空の人間とか。

これなんかは何のために作られている？機械で作った楽曲を聴いてファンは喜んでいるの？誰が嬉しいの？聞いてみたい、の好奇心を満たしたいだけなの？

アーティストの許諾なしに AI に学習させて楽曲を制作するのは

音楽業界のすべての関係者に、歴史のどちら側にいたいのかという問題を提起している。アーティストやファン、人間の創造的な表現の場にとどまる側か、もしくは、ディープフェイクや偽物を受け入れ、アーティストに正当な対価を払うのを否定する側かだ

との見解を示し、音楽生成AIによるアーティストの権利侵害を強く牽制した。

人気アーティストの声を使った「生成AI楽曲」が一大ブーム = 著作権違反か、グレーゾーンか？ | The HEADLINE

法整備が大変そう。

膨大な情報をもとに自動生成された、歴史とか思いとかがない創作物ってなに？
虚構のAIグラビアアイドルの写真集って、生成の作業をしてる人間のことが思い浮かんでなんか嫌じゃない？「届けたい」「伝えたい」が無い音楽の魅力って何？邪魔にならなくて場所に馴染むいい感じのBGMとして使うことを想定している？

省人化や時間短縮等の効率化、金儲け、手段を目的にすること…
いろいろ考えて、最近の盛り上がりに対してあまりポジティブな気持ちになれない。知らないわからないものに対して否定的な態度になってしまうのはいつものことではあるけど（いろいろやっていくうちに必要性をわかったり納得できたりして考えが変わることが多々）

創作物の何を見ているか、見たいか

個人の経験や知の蓄積（思想や信念も含む）：足を使って身をもって得た情報に面白さを感じる。
その情報を得たときの個人的な状況、目的と直接関係ないことも含めての体験談。
たとえば、その土地でしか見られない生き物を見に行き、この目で見ることができたときの天気や、そこに行くまでの気持ちや方法、見た後の景色、食べたもののこと、とか全部。
出力方法としてのメディアは多種多様だ。情報をどうやって表現しているか方法を見るのも面白い。

なにか展覧会へ行くとき、そこに展示された表現を見て、生み出されたバックグラウンドを知り、表現そのものだけでなく周辺のことも想像することを楽しんでいる。帰ってからもっと詳しく調べるのも楽しい。え？何を言いたいんだこのテキストまとまらなくなってきた

結局なんなの

今は、平面的で即物的な(日本語合ってる？)AI活用法だけわかっている状態。
視野を広げて考えてみよう。あと、天邪鬼にならず、もっと理解しようとする姿勢を持とう！
それはそれとして、自分の頭で考えたことを自分の言葉で表現することは続けたいと思う。

世の中の動きに対して、受け入れたいけどモヤモヤすることをとりあえず考えてみようの記事おわり。アイキャッチはStable Diffusionで作成。

※追記※

上記文章まとめた後に見て、ふむと思った記事

“文化的なAI”とものづくり（前編）｜雑誌『広告』 “文化的なAI”とものづくり（後編）｜雑誌『広告』

Adobe FireflyのAI生成画像は著作権クリアするようだ(※beta版はウォーターマークあり)。生成再配色や自然な画像拡張は使えるかもしれないな。

生成塗りつぶしで創造力をさらに広げよう