https://www.ifrv.net

AI BLOG strategy

生成AI(ChatGPT/Stable Diffusion等)は文明の利器か破壊者か~激変する私たちの『仕事と生活』

2023年4月22日

この1、2か月でなんだか気がつかないうちに、ChatGPTをはじめとする
ジェネレーティブAI(Generative AI、生成AI)
の話を聞かない日がなくなったように思います。

私はこちらの記事でも述べたように、自動運転などで使われる
認識系AIのほうに10年を超えて関わってきましたが、一般の人にとって
わかるようでわからない『AI』という単語がこれほど日常的に使われることになるとは
つい先日まで想像すらできませんでした。

ジェネレーティブAIに関するニュースはすでに溢れかえっていますが、
あらためて今起きていることと、これから起こりそうなことを
一般市民の生活者目線で、現時点での考えをまとめてみたいと思います。

私は楽観主義でも悲観主義でもありません。
ただ、今日現在もいくつかのAIシステム開発現場にべったり関わっている分、
こいつ(=AI全体を言っており、生成AIや認識系AI含む)の可能性も恐ろしさも
日常的にひしひしと身近に感じながら仕事しています。

「遂に"第4次AIブーム"到来!?」と言えるワケ

国内でAI研究の第一人者である、
東京大学大学院の松尾豊教授はこのようにコメントされています。

ChatGPTの登場で
「インターネットの発明よりも大きな変化が起きる」

NHK:サイエンスZEROより引用

ここ1、2か月の状況を見て私もそうかもしれないと思うようになりました。

これまでに何度も「AI」を持ち上げるブームがありましたが、
日の目を見るようになったのが「第3次」、
そこに被さるように爆発的に広がりつつある生成AIによる今が「第4次」

私は概ね次の図のように理解しています。

第4次AIブームまでの流れ

「第4次」はChatGPTをはじめとする生成AI(ジェネレーティブAI)が起爆剤になっています。
生成AIのインパクトと浸透は半端ではありません。

どのくらい半端ではないかは数字が示しています。
その目安のひとつは利用者が1億人を超えるまでの期間

1億人の利用者獲得まで・・・

Netflixでは3年半、
Instagramでは2年半、
TikTokは9か月かかったそうです。

これらに比べてChatGPTはどうかというと・・・
2022年11月30日にOpenAIが「ChatGPT」無料公開しました。

その後ChatGPTはたったの2か月で1億人に達したようです。

これは単に数字の問題ではなく、今後世界で生きている人の一定の数は
ChatGPTの世界に常に浸っている可能性を示唆しています。

なおAI全体の話に戻ると・・・

世界で主導しているNo.1はアメリカ、そして次は中国だろうと思っています。
残念ながら我が国はAIに関しては周回遅れと言われてもおかしくないです。
AIの開発現場にいるとそのことがひしひしとわかります。

そもそもMade in Japanで世界を驚かせるAIが出ていないことがその証拠です。

なお『深層学習』(Deep Learning)が学術論文になったのは1967年であり、
かれこれ開花した「第3次」までに50年要したことになります。

この深層学習が成熟し、自然言語系のAIとしてデビューしたのがChatGPTであり、
他の例では画像生成AIStable DiffusionMidjourneyなどがとても有名です。

いずれもアウトプット品質があまりに優れ、
このメリットを享受できる人と、逆に職を失う人に分かれる・・・
そういった可能性に踏み込んで参ります。

なぜ「生成AI」が爆発的人気?

それにしても、ChatGPTはなぜこんなに注目を集めているのでしょうか?

繰り返しになりますが、ChatGPTは自然言語系の生成AIです。

一般に「AI」という世界にはいろいろなジャンルがあり、
生成AIはそのひとつです。

冒頭で述べたように、私が関わってきたことは
インプット情報から何かを識別して抽出する分野です。

つまり認識系AIというものであり、例えば自動運転でのAIですが、
「まともに動いて当たり前」
という非常に厳しい要求がある世界です。

自動運転だけではなく、カメラやスマホなんかにもある画像系AIは
認識そして解析がメインであり、すべてバックで動く機能です。

認識系AIはいわば「裏方」としての存在かもしれません。
動いて当たり前、あとはいかにより良い効果を生み出せるか、です。

ところが生成AIはまったく違います。

人が苦労して生み出している領域
そのものに深く関わっていて、裏方というよりもむしろ
「主役」に抜擢されているかのようです。

主役として演じている、或いはこれから演じると予想できる領域の例では;

  • 机に座って普通にある事務的な仕事
  • 創造力(クリエイティブ)を必要とする仕事
  • 面倒だがやらないとならない仕事(議事録などの要約)
  • 専門的スキルが必要とされる仕事(弁護士、数学者、コンサルタントなど)
  • etc・・・

要するに・・・

これまで人のやってきた仕事の肩代わりです。

しかも普通の人が常日頃から悩み、苦労していること、面倒なこと、さらには
脳に汗をかき「何かを作り出す」という仕事を肩代わりしてくれていることです。

ここだけ聞くと超便利!とだけしか思えません。

積極的に生成AIを使うことにより、業務の効率化や質的な向上
推進を目指す国内企業もすでにたくさん現れています。

業務の効率化とは、スピードアップ、品質アップだけではなく、
コスト削減にもつながりますね。

質的な向上とは、サービスのグレードアップ、商品のより効果的なPRなんかも該当します。

企業がChatGPTを採用する場合は、入出力情報が社外の第三者へ漏れないように
クローズドな仕組みを構築しますが、まぁこれは当然です。

それはさておき、超便利で優秀なため、
「ああー楽~!!!」
になったと喜んでばかりはいられません。

これが何を意味するかはもうお分かりでしょう。


ほとんどのホワイトカラーを直撃する生成AIのインパクト

AI自体は善でも悪でもない、ということを先に言っておきたいと思います。
AIの働きや存在をどう判断するかは人間です。

「ChatGPTを使って、めちゃめちゃ仕事が楽になった!!」
と無邪気に喜ぶのは早計です。

企業や役所、それどころか政府も前向きにChatGPT採用を考えていますよね。

国会でChatGPTを使う使わないの議論もこれから盛り上がりそうです。
少なくとも国会で眠りこけている議員よりChatGPTのほうが、
いやChatGPTを応用して「バーチャルなAI議員」使うほうがましなようにも思えます。

まったく新しいテクノロジー、例えばインターネットの登場時もそうですが、
これのメリット、デメリットを並べたてたところで今や世界中の人が
日常生活の中で「当たり前に存在するもの」として利用しています。

全体としてみれば、生成AIもそのようにデメリットを
メリットが上回り、世の中にプラスの変革をもたらす可能性が大です。

ただ・・・めちゃめちゃ仕事が楽になった!!
と喜んでいる人は、その仕事が生成AIによって奪われる可能性を忘れているようです。

企業からみると、AIによる効率化が進むとそれは必然的に人員削減に繋がります。

例えば・・・
画像生成AIが使われる世界ではとっくに仕事を猛烈に奪う現象が出ています。

MidjourneyStable Diffusionといった画像生成AIの出来は正直素晴らしいレベルです。
出来上がった画像やイラストは人が作ったものなのか、AIが作ったものなのか
・・・う~ん、見分けがつかない
と言ってよいほどのレベル。

AI先進国の中国では、すでにゲーム業界のクリエイターたちが職を追われる状況になっているようです。

テクノロジーメディアの「restofworld」によると、
これまでゲーム用のビジュアル1枚につき、だいたい約5万8000~13万6000円くらいの報酬、
しかも1週間くらいかけて作っていたものが生成AIによって『数秒』で置き換わると。。。

この話を伝えているGIGAGINEの記事はとてもわかりやすいです。

AIが中国で既にイラストレーターの仕事を奪い始めている、現場の悲鳴と実際にどのようにAIが用いられているのかをまとめたレポートが公開 - GIGAZINE
AIが中国で既にイラストレーターの仕事を奪い始めている、現場の悲鳴と実際にどのようにAIが用いられているのかをまとめたレポートが公開 - GIGAZINE

Stable DiffusionやMidjourneyの登場により、画像生成AIに対する期待は爆発的に高まっており、今やWindowsの標準ブラウザであるEdgeにも画像生成AI機能が搭載されています ...

gigazine.net

画像だけではなく、テキストから動画を作り出す技術も出てきました。

NVIDIA(エヌビディア)という会社をご存じでしょうか?
PCでゲームを楽しむ方なら『GPU』という単語は聞いたことがあるのでは?

カリフォルニアにある半導体メーカで、GPUを開発している企業でもあります。
GPUとはGraphics Processing Unit、つまり画像処理装置。
これがAIの学習・推論に使う演算処理にとても相性が良いのです。

現時点ではさらに、こんな動画が欲しいなぁ・・・と
テキストを入力すると高解像度の動画を自動で作成する
VideoLDMを発表したのがこの半導体企業:NVIDIAです。

私は20数年前には、NVIDIAを使ってシステムLSIの開発に
取り組んでいた時代もあるので個人的にはよく知っている企業です。

で、
どんな動画を作れるのかは、このTOPページに出ている
たくさんのサンプル動画をご覧になるだけで一発でわかります。

Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models
Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models

Align your Latents: High-Resolution Video Synthesis with Latent Diffusion Models

research.nvidia.com

VideoLDMでは、ChatGPTと同様にテキストで例えば
「ピアノを弾くコアラの動画を1980 x1080pixelで作って」
と入力するだけで数秒間(←今のところは、です)の動画を自動生成します。
(※サンプル動画にもコアラ出ていますね)

こういうあっという間の進化を見て驚くばかりですが、
クリエイターがあれこれ悩んでできる同等以上のクォリティを
AIが肩代わりできる時代になったということです。

言われたままを作るプログラマーは役に立たない時代へ

エンジニアリングという視点でもう少し深掘りしてみます。

プログラミング言語が多数ある中で、最近いくつかの学校の先生に聞いたところでは
授業でCやC++だけでなくJavaやC#などのオブジェクト指向言語を扱うことが多いようです。
またSQLなどデータベースなども採り入れていると聞きました。

これらは確かに実務でニーズがあることは事実です。
そして、今まではこういったスキルを高いレベルで使える人がもてはやされてきました。

ところがこの感覚もChatGPTの出現で怪しくなってきたように思います。

ChatGPTが出来の良いソースコードを作り出せることは既に知られています。
ミスがあっても繰り返せばそれを修復していき、精度の高いコード生成ができるのです。

今の段階でも、一般のプログラマーがシコシコとコードを作ることよりも
ChatGPTの作り出すコードのほうがはるかに優れている可能性もあると言えます。

そうなると・・・
プログラミングって仕事は人がやる必要があるの?

という疑問が必然的に出てくるわけです。

人がプログラミングすることで、バグは100%どんなシステムでも出てきますので
私が関わってきた中では、これも20年くらい前になりますが当時から
ノーコード化(或いはコードレス)の発想が試行されていました。

2000年代前半、例えば自動車の中にあるさまざまなプログラムを
ツールで自動生成できないかと、そういったツールや開発環境の構築を目指しておりました。

もちろんAIではありませんよ。
人がゴリゴリ作ったソフトウェアツール、開発環境を整備して
プログラムをそのツールに作らせてみよう、という発想です。

こういったコンセプトは今はさらに発展して、専門的にはモデルベース開発と呼ばれますが、
この開発に向いたそれ専用のシミュレーターのようなものがあって、車の中のさまざまな機能は
シミュレーターが吐き出すコードを使うようになりました。

つまりエンジニアはコードを書くのではなく、
コードをうまく書かせるための仕組み(モデル)を作っているようなものです。

こういった状況に生成AIが仲間に加わると、
じゃぁ、人はいったい何をすればいいの?
という時点に立ち戻って考えないとなりません。

私がこの先に予感していることのひとつは、
すでに今でもそうなりつつあると感じていますが・・・

言われた通りに作るだけのプログラマーはいらない。
なぜならそこはAIがやるから。

ということです。

特に今のアラフォー世代までは人力でいかに良いコードを書くか
に注力してきたはずなので、その先を見る必要があるように思います

プロンプトエンジニアリングという仕事が重要になるかも

ChatGPTの特性として、質問の仕方で答も変わる
ということが知られており、これは重要なキーワードです。

質問したけど、答がイマイチ・・・
というケースのほとんどは質問の仕方が
欲しい答を得るために足りていない、どこかまずいというのが原因です。

私の関わっているAIチームの中では、ここで問われる
「質問力」
に関心をもって研究も進めています。

つまりChatGPTの入力文、プロンプトの工夫です。
既にこう入力すればこうなるという無駄の無い質問パターンをいくつか発見できています。

そのプロンプトを最適化するスキルはこの先、結構な需要があるように感じています。

何をどのように質問すれば欲しい答を取り出せるか?
という技術で私たちのチームではここをプロンプトエンジニアリングと呼んでいます。

作り出す仕事はこの際、AIに任せてしまうと割り切って、
人はむしろいかに良いアウトプットをAIに出させるかを考える
それがプロンプトエンジニアリングです。

2022年までは存在しない、想像すらできない仕事でしたが、
2023年以降は突然に可能性のある仕事として需要がありそうで今後注目しています。

おそらくこのスキルをそれなりにマスターできる人は、
フリーランスとしても活躍の場が多くなるような予感がします。

最後に~プロンプトエンジニアリングを活かす商品・特典などの構想

すでにChatGPTをいかに使いこなすか的なセミナーや塾などが
高額塾(30万円クラスで)としても販売開始されているのが現状です。

ChatGPTは今後もどんどん進化し、そのスピードは驚異的なため、
今はこれをこう使えば稼げる!
と思ってもあっという間に陳腐化して
企画が錆びついてしまうリスクがあることをご理解ください。

しかもアナログ的ななだらかな変化ではなく、突然変異的な変化であり、
これまで商品化されてきたものと比べて正直、異質な進化が予想できます。

私自身は、偶然にもネットでのビジネスに関わりつつ
一方でAIという技術にも長く浸ってきた経験から、
私だからお伝えできるノウハウもあると考えております。

そのひとつが先ほどのプロンプトエンジニアリング。

これを例えばLP作成や、商品コンテンツに応用
KENBOならではのユニークな内容で、商品や商品の特典などで提供を考えているところです。
(私の【異端メルマガ】読者様、また関係する商品の購入者様を最優先で一番有利な条件でご提供します)

簡単に言うと、ネット上での商品作りや販売を考えるに、
AIに任せるところはここ、
その任せ方(指令方法)はこれ、
AIが作ったものはこう使う

というようなものです。

私は生成AIの専門家ではありませんが、
AIというものの共通した素性は熟知しています。

まったく新しい分野として、いかにして
生成AIの奴隷ではなく、うまく付き合えるかを研究中です。

これがうまくいくと、マーケティングひとつにおいても
人は本来のもっと違う次元に頭と労力を使えることになります。

本当の『楽する』という意味はこういうことだと信じています。