ChatGPT・Midjourney 実装入門ガイド - AI ツール活用のコツ

《AI ツールクイック理解ガイド - 実装編》

大学院時代にニューラルネットワークについて少し研究していたため（アメリカで論文発表もしました。今思うと信じられません）、AI の発展を継続的に注視してきました。当時は AI 業界は宣伝ばかりで実績が伴わず、発展速度が遅く、ブレークスルーが見つかりませんでした。しかし近年、おそらく計算能力が急激に向上したため、従来は計算不可能だった（または天文学的な時間がかかった）計算も可能になり、速度最適化に時間を費やす必要がなくなり、検証に必要な時間も大幅に短縮されました。そのため AI は急速に発展し、ChatGPT の登場が「シンギュラリティ」の到来だと言う人さえいます。

理論的な説明は割愛し、最近様々な AI ツールを試してみた経験をシェアしたいと思います。AI の世界に素早く入りたいという方々の時間と不安を軽減できれば幸いです。（会話のネタも一つ増えますしね）

注：この記事で登場するかわいい女性キャラクターたちは、Midjourney で生成したものです～

ChatGPT

まず ChatGPT についてです。ChatGPT は学習済みモデルに存在するデータについてのみ回答でき、回答がない場合は自分で推測・脚色してしまうため、オープンエンド質問の正確性は低いことが多いです。例えば自分の名前を聞いても、もっともらしく答えますが間違っています。

同様に、事実性の高い問答において ChatGPT の精度は実は低いため、人間の専門知識による判断が必要不可欠です。

ChatGPT は偽ニュースは作成できますが、ニュースは作成できません

また、現在のモデルは 2021 年までのデータに限定されており、リアルタイム更新ではないため、ニュース記事の作成は不可能です。実際にニュース記事の改写を試してみると、非常に精度が低いです。これは ChatGPT が次の単語を予測する方法で生成するため、ニュース記事の文体が確率予測には不適切だからだと考えられます。（幸いなことに、ChatGPT は確率ベースのアルゴリズムを使用しているため、逆説的ですが）自動的に数字を改ざんしたり、無関係なコンテンツを追加してしまいます。ただし見た目はもっともらしく見えるため、容易に偽ニュースが生成されます。現段階では記者や編集者の代替にはなりませんが、偽ニュース作成は驚くほど簡単です。

ChatGPT はアウトライン作成に最適です

しかし ChatGPT は大綱作成や初期段階のブレーンストーミングなど、正誤のない補助ツールとして非常に適しています。例えば「50,000 字の小説を書きたい。主人公は女性で、人生をやり直す話。内容に SF、サスペンス、温かさ、そして教訓を含めたい。小説の大綱をください」というような標準的な答えがない創作では、ChatGPT は多くの着想を提供できます。気に入らない部分があれば、修正を依頼することもできます。大綱ができたら、肉付けを依頼すれば、実際に小説を完成させることができます。ただし、モデルの制限により、生成される小説は無難ですが、それほど面白いとは言えません。したがって現段階では、作家の方々は心配する必要はありませんが、創意工夫が必要な時は相談できますし、ChatGPT だけでは良い作品は生まれません。

ただし、「補助ツール」として使用すれば、非常に質の高い知識系コンテンツを生成することができます。これは既に実装しています。

ChatGPT は提案書や文案作成に最適です

例えば「XX のビジネス提案書を書いてください」「XX 商品のマーケティングコピーを書いてください」「式典の挨拶を書いてください」というような正誤のない内容については、非常にもっともらしく書くことができます。ただし専門家が一目見れば、内容は空疎で、専門用語を積み重ねた魂のないコンテンツであることがわかり、実務経験のある教授に採点されれば不合格になるようなレベルです。しかし入札書や補助金申請の補助として使用すれば、大綱を考える時間をかなり短縮できるでしょう。

もう一つ ChatGPT が得意なのは、「既存の記事」の要約と翻訳です。最も便利な方法は、原文記事を貼り付けて、翻訳とともに重要なポイントを抽出することを依頼することです。この点でかなりの時間を節約できます。ただし実装してみると、正確性の問題は残ります。翻訳ソフトが現在 100% 正確ではないのと同じように、重要な文書は専門家に依頼する必要があります。

ChatGPT は数学が得意ではありません

ChatGPT は計算器ではなく「言語」モデルであるため、数学は得意ではありません。数学は言語モデルで無理矢理計算しているため、数学の問題は質問しないでください。

ChatGPT は単純で一般的なプログラム作成はできますが、複雑なものは無理です

ただし ChatGPT はプログラミングが得意なようです（友人たちが共有した事例から）。おそらくモデルの関係だと思いますが、私が長い間やりたかったプログラム取引の実装をテストしたところ、彼のモデルには多くの一般的なプログラムコード片があるようですが、私の特殊なロジックに従わせると失敗します。彼は常に一般的な取引プログラムのコード片を勝手に追加してしまいます。API ドキュメントも実際には確認せず、適当に答えてきます！（詳細な実装テストプロセスについてはAI はプログラマーの代替になるか？実装結果の発表をご参照ください）

ChatGPT はジョークが下手です

ちなみに ChatGPT にはユーモアセンスがなく、ジョークは非常に下手です。笑いのポイントが全く面白くありません。

Line 版の ChatGPT

最近、日本の企業が Line に ChatGPT を統合し、Line で ChatGPT を検索するだけで「AIチャットくん(ChatGPT)」というボットが使用できるようになりました。私は Premium に加入しており、月額 680 円で、ウェブ版より高速で使いやすく、ログインする必要がなく、エラーが起きにくいです。

Midjourney - 画像生成 AI

次に Midjourney などの画像生成 AI についてお話しします。最大の障壁は、初めにどうやって始めるかだけです。Midjourney は Discord 内のチャットボットなので、まず Discord をインストールする必要があります。（Discord はコミュニティソフトウェアで、多くのチャットルームを開くことができ、他の人が作成したボットとチャットすることもできます。Midjourney はボット方式でコマンドを受け付けて出力する賢いボットです）その後、Discord 内で Midjourney というボットとチャットします。

Stable Diffusion - 画像生成 AI

Stable Diffusion は、最近非常に人気のある、小型モデル写真撮影を置き換えることができるソフトウェアです。ウェブ版がありますが、使用されているモデルは平均的で、非常に優れた画像を生成することは容易ではありません。優れた画像を生成するには、いくつかのプログラムをインストールし、GPU を使用して実行する必要があります。ここでは詳しい解説はしませんが、環境セットアップが完了すれば、実際には難しくありません。（ただし Stable Diffusion は商用利用可能と述べていますが、一部のモデルは商用利用を禁止しているため注意が必要です）。現在では Google Colab クラウドで実行可能なバージョンもあります。詳細はこのページを参照してください。

Midjourney の商用利用条件

Midjourney の現在の規約では、有料ユーザーになると生成物の商用利用が可能です。企業の年間売上が 100 万ドルを超える場合は、Pro プラン（月額 60 ドル）の使用が必須となります。

Midjourney は美術家の失業につながるか？

Midjourney は実務上、非常にリアルな製品情景図や記事の付属画像を生成でき、絵を描けない人（私）でも自分で画像を「詠唱」することを可能にしています。この部分は既に実装し、しばらく使用していますが、効果は非常に良く、何度修正を重ねても機器は文句を言いません（ChatGPT は機嫌が悪くなります...）。生成された画像を設計者と協力して使用するか、Canva のようなソフトウェアで自分で調整すれば、大量の労力とコストを節約できます。

しかし、美術家が失業するか聞かれれば、設計スキルを持ち AI を受け入れる人は、より多くの仕事機会を得るだろうと考えます。深い美術スキルを持つ友人が既に Stable Diffusion を使用して画像生成しており、本当のところ、深い造詣を持つ人が生成した画像は、我々のような素人とは全く異なります。

私自身の例では、AI で自分で画像を描くことができなければ、高額な画像制作費を負担することはできず（時間的な往復も困難）、その後、完成した画像をデザイナーに加工してもらい商業用に仕上げることもできません。しかし AI を活用することで、起業の敷居が大幅に下がりました。様々なテクノロジーツールを従来の外注や従業員採用の代わりに活用することも、会社設立初日から利益を得られた理由の一つです。

AI 音楽については、実は数年前から存在していますが、現在ネット上で AI 音楽をオンラインで作成できるサイトは多くあります。ただし、実装テストしてみた感想は、聴取可能な音楽は生成できますが、品質的には満足できません。ビデオのバックグラウンドミュージックや効果音として使用する場合、調整技術が十分であれば全く問題ありませんが、「ヒット曲」レベルの音楽創作にはまだ大きなギャップがあります。

AI 画像テキスト生成技術 - D-ID、剪映

次は AI 画像テキスト生成技術で、動画制作は現在ワンクリックで生成できます。ワンクリック編集＋音声機能のソフトウェア（例えば剪映ダウンロード版）があり、編集技術のない人はもう心配する必要がありません。テキストの段落に従って自動的に編集し、ユーザーは微調整するだけです。キャラクターが話す＋音声機能のソフトウェア（以前デモンストレーションしました。Midjourney で主演者を描き、ChatGPT で放映台本を作成し、D-ID に入力すると、バーチャル主演者の音声ニュースレポート動画が完成します。音声はもう機械とはほぼ判別できないレベルですが、現在のところ人物の動きはまだぎこちないです。この放映動画はFacebook のこの投稿を参照）。これらのツールのインターフェースはおばあちゃんでも簡単に操作できるほど洗練されていますが、その後の応用方法が勝敗を分ける重要なポイントです。

AI 生成物の著作権問題

著作権の問題については、現在各国の法律は非人類生成の著作物を保護しない傾向にあります。つまり、AI で生成した作品を他人が盗用した場合、賠償請求は非常に困難です。数年前、AI で無数の音楽フラグメントを生成し、著作権トロール（権利者として不当に訴訟を起こす者）として各地で賠償請求しようとした人がいましたが、機械生成であるため無効と判決されました。

以上が AI ツールに関する小さなシェアです。AI の世界に未だ入っていない方に、できるだけ分かりやすく、素早く全体像を理解していただければと思います。

産業での AI の応用と実践的な課題

AI の発展は確実にこれらの to C アプリケーションより先行しており、応用範囲も非常に広く、工場の生産ラインエラー検出、精密ターゲット広告配信、個人化コンテンツ推薦など、既に多くの年月の発展がありました。しかし最大の問題は、AI データ科学者や研究専門家が業界の domain knowledge（領域知識）が不十分な場合、「ゴミを入れればゴミが出る」という結果になることです。理論は正しいのに、結果が間違っているのです。これは私と吳仕強の間で多くのプロジェクトで見られた課題です。

ChatGPT・Midjourney AI ツール入門ガイド - 実装経験から学ぶ

《AI ツールクイック理解ガイド - 実装編》

ChatGPT

ChatGPT は偽ニュースは作成できますが、ニュースは作成できません

ChatGPT はアウトライン作成に最適です

ChatGPT は提案書や文案作成に最適です

ChatGPT は数学が得意ではありません

ChatGPT は単純で一般的なプログラム作成はできますが、複雑なものは無理です

ChatGPT はジョークが下手です

Line 版の ChatGPT

Midjourney - 画像生成 AI

Stable Diffusion - 画像生成 AI

Midjourney の商用利用条件

Midjourney は美術家の失業につながるか？

AI 画像テキスト生成技術 - D-ID、剪映

AI 生成物の著作権問題

産業での AI の応用と実践的な課題

関連記事

お問い合わせ

最新ニュース

《AI ツール クイック理解ガイド - 実装編》

ChatGPT

ChatGPT は偽ニュースは作成できますが、ニュースは作成できません

ChatGPT はアウトライン作成に最適です

ChatGPT は提案書や文案作成に最適です

ChatGPT は数学が得意ではありません

ChatGPT は単純で一般的なプログラム作成はできますが、複雑なものは無理です

ChatGPT はジョークが下手です

Line 版の ChatGPT

Midjourney - 画像生成 AI

Stable Diffusion - 画像生成 AI

Midjourney の商用利用条件

Midjourney は美術家の失業につながるか？

AI 画像テキスト生成技術 - D-ID、剪映

AI 生成物の著作権問題

産業での AI の応用と実践的な課題

関連記事

お問い合わせ

最新ニュース

《AI ツールクイック理解ガイド - 実装編》