ChatGPTを徹底解説!日常生活になくてはならないツールです

生成AIの読み物

ChatGPTを徹底解説しました。この記事を読むことで、ChatGPTについての理解が深まります。これからの日常生活になくてはならないツールです。

►はじめに

テレビやSNSで「ChatGPT」という言葉を目にすることが多くなりました。ChatGPTを日常生活で活用することができれば、生活そのものの質が向上します。ひとりで深く悩むことがなくなり、ChatGPTと共に、課題解決をしていくことができるようになります。

わかりやすく共有していきます。

►ChatGPTを徹底解説|概要

ChatGPTを徹底解説 概要

ChatGPTは2022年11月30日に公開された、OpenAIが提供する生成AIです。チャット形式の構造になっています。

使用すると、まるで人間と会話をしているかのような感覚になります。とても不思議な感覚です。友達とLINEのやり取りをするように使用することができます。

またすぐに必要としている答えを得ることができ、創造的なインスピレーションを得ることができます。さらにChatGPTを通して新しいことを学ぶこともできます。

このようなChatGPTはiOS、Androidのどちらでも使用可能です。下のリンクからダウンロードすることができます。

►ChatGPTを徹底解説|発表後2ヶ月でユーザー数1億人を突破

ChatGPTは猛スピードで世界中に広がりました。発表から4日後にユーザー数が世界で100万人を超え、2か月後の2023年1月に1億人を突破したと言われています。

世界的に大人気のTikTokは、ユーザー数1億人を達成するのに約9ヶ月かかっており、Instagramは2年半です。ここから、ChatGPTの認知されるスピードの凄まじさがうかがえます。

なお下の画像は、SimilarWebが提供する「2023年12月から2024年2月のChatGPT訪問者数の割合」です。

日本はこの時点で、世界で5番目にChatGPTを活用している国ということがわかります。「ChatGPTを活用している人の約4%は日本人」ということになります。

利用者の割合

✓補足

ChatGPTは2023年2月の時点で、訪問者数が10億人を突破しています。

►ChatGPTを徹底解説|どんな質問にも対応してくれる(質問例を紹介)

ChatGPTはどんな質問にも対応してくれます。

✓例えば下記のような質問に答えてくれます

・ある語彙についてクイズを出してください

・このレシピをギリシャ語に翻訳してください

・楽しいディナーパーティーの計画づくりを手伝ってください

・ポップコーンが弾ける理由を説明してください

・雨の日のアクティビティを説明してください

・初心者向けに麻雀を教えてください

・この職務内容を改善するためにサポートしてください

・Pythonスクリプトを作成してください

・腰の痛みを軽減するストレッチの方法を教えてください

・ハーフマラソンのトレーニングを手伝ってください

もちろん年中無休、24時間対応可能です。どんな時でも精度の高い返答をしてくれます。

日常生活の中で困っていることやひとりでは解決できない問題などに対して、的確な返答をしてくれます。

►ChatGPTを徹底解説|特徴「見て、聞いて、話せる」

ChatGPTは「見て、聞いて、話せる」という特徴があります。

どの特徴においても、精度が非常に高いです。

◼︎特徴その1:見る(GPT-4で利用できます)

チャットの中で画像を添付することができます。添付された画像をChatGPTが分析して、画像について具体的に説明をしてくれます。

例えばグリルが起動しない原因を調べて、解決するためのサポートをしてくれたり、冷蔵庫の中身をチェックして食事のメニューを考えてくれます。

画像を添付するときは、まずホーム画面にあるプラスマークをタップします。

ChatGPTを徹底解説 添付方法

次に、写真のマークをタップします。

添付方法

写真のマークをタップすることで、保存している画像を選択できる画面に切り替わります。

例として、画像を添付してみました。

画像を添付すると下の画像のようになります。

ChatGPTを徹底解説 画像添付

画像を添付しながらテキス入力も可能です。

テキストも入力できる

テキスト入力をすることで、より具体的に画像内について詳細な内容を提供してくれます。

「ChatGPTを徹底解説」 出力内容

画像をしっかりと認識しています。出力された説明文の精度も非常に高いです。

また、「この画像の何がおかしいのか」についての認識もしてくれます。

おかしい場所について

さらに論文のような複雑な文章を含んだ画像でも、対応可能です。添付した画像をもとに、問題を深掘りすることもできます。

ChatGPTを徹底解説 論文も理解する
論文も理解する

◼︎特徴その2:聞く

ChatGPTはテキストだけでなく、音声機能もあります。聞き取る精度の非常に高いです。

両手が塞がっている状況でも、効率よくChatGPTとのやりとりができます。

なお、使用する際はスマホのアプリを使用します。

まずホーム画面にあるヘッドホンのマークをタップします。

ChatGPTを徹底解説 音声機能

タップすると、下の画像のような画面に切り替わります。この画面でChatGPTの音声機能を使用することができます。

音声機能

◼︎特徴その3:話す

また、ChatGPTは話すこともできます。

まずホーム画面から、メニューバーを開くためのボタンをタップします。

話す

タップすることでメニューバーが画面に出てきます。

次に、一番下にある登録した名前をタップします。

ChatGPTを徹底解説 話す

登録した名前をタップすることで、設定画面に切り替わります。

設定画面のSPEECHにあるVoiceをタップします。

話す

Voiceをタップすることで、音声変更ができる画面に切り替わりました。

2024年4月時点で、Ember、Sky、Cove、juniper、Breezeの5名の音声に切り替えることが可能です。

音声機能を活用するとわかりますが、実際に人と話しているかのようです。息継ぎもしていますし、言葉に抑揚があります。

僕は初めて活用したときに驚きました。

スピーカー変更

ChatGPTの音声は、テキストと数秒のサンプル音声によって人間のような音声を生成することができます。プロの声優と協力して作成されたそうです。

下の音声サンプルになります。juniperを使用したものです。

また、音声機能を通したChatGPTとのやりとりは、全てテキストに変換されます。なので、話した内容やChatGPTが教えてくれた内容を忘れることはありません。

►ChatGPTを徹底解説|料金

料金については使用するモデルについて異なります。

✓下記がモデルごとの料金です

・GPT-3.5:無料

・GPT-4(ChatGPT Plus):3,000円/月

►ChatGPTを徹底解説|模擬司法試験上位10%で合格した超優秀な「GPT-4」とは?

ChatGPTを徹底解説 GPT-4

次に有料版で使用できるGPT-4について解説していきます。この章を読むことでGPT-4がどれだけ優秀な生成AIなのかが理解できます。

有料版を検討している人は、ぜひお読みください。

◼︎GPT-4の概要

GPT-4は大規模なマルチモーダルモデルです。同じくGPT-3.5もマルチモーダルモデルです。

✓マルチモーダルモデルとは?

テキスト、画像、音声など、複数のデータ形式を理解し、それらを組み合わせて情報を解析する能力を持つAIのこと。

複雑な状況では人間より能力が劣ります。しかし様々な専門的・学術的な評価では人間と同じようなパフォーマンスを発揮することがわかっています。

例えば司法試験の模擬試験では、受験者の上位10%程度のスコアで合格しています。ちなみに、無料版のGPT-3.5のスコアは下位10%程度でした。

◼︎GPT-3.5とGPT-4を比較

GPT-3.5とGPT-4を比較することで、より性能の違いを理解することができます。

GPT-4はGPT-3.5に比べて複雑なタスクを行うことができます。また深い理解と分析が必要な問題に取り組むとき、強さを発揮します。細かい指示やニュアンスも理解してくれます。

実際に使用してみるとわかりますが、レベルの高さに驚愕します。「模擬司法試験上位10%で合格した」のも納得です。

☐テストで比較

下の画像は様々なテストでGPT-3.5とGPT-4の性能を比較した棒グラフです。縦軸はパフォーマンスの割合、横軸はテスト名やデータセット名になります。

✓データセットとは?

AIが自然言語(人が話す言語)をどの程度理解し、それを活用できるかを測定するために使用されるもの。 

青色のグラフがGPT-3.5、緑色がGPT-4です。

グラフ

棒グラフから、ほとんどのテストでGPT-4がGPT-3.5よりも優れていることがわかります。特に一部のテストでは、GPT-4の性能が大幅に向上していて、100%近いスコアを出していることがわかります。

☐機械学習モデル用の評価方法で比較

ChatGPTのような機械学習モデルを評価するための評価方法(ベンチマーク)を活用して、GPT-3.5とGPT-4を比較しました。

✓ここでは以下の評価方法を用いました

MMLU(57科目の選択問題)

・ヘラ・スワッグ(日常の出来事に関する常識的な推論)

・AI2推論チャレンジ(小学生向けの小学生向けの多岐選択式科学問題集)

・ウィノグランド(代名詞の解決をめぐる常識的な推論)

・ヒューマンエバール(Pythonコーディング)

・DROP(読解力と算数)

評価の結果は下の表のとおりです。

ChatGPTを徹底解説 評価結果

この表から、GPT-4が言語理解とタスク処理において非常に高い性能を持っていることがわかります。すべての評価方法でGPT-3.5を上回っています。

☐24の言語でGPT3.5の英語パフォーマンスを上回る

下のグラフは、GPT-4がMMLUというテストを「異なる言語」で行ったときの結果を表しています。横軸は正解率、縦軸は各言語を表しています。

グラフ

このグラフから、GPT-4は多言語に精通していることがわかります。その中でも最も優れているのは英語の85.5%です。ちなみに日本語での結果は79.9%でした。

さらにイタリア語やアフリカーンス語、スペイン語などでも80%を超える性能を発揮しています。

マラーティー語テルグ語では正解率が60%台ではあるものの、それ以外の24の言語でGPT-3.5の英語能力を上回っています。

◼︎成長途中のGPT-4

GPT4の解説を見ると、どんなことも完璧にこなせそうなイメージが生まれます。しかし、GPT-4は今もなお成長を続けていて、日々新しいタスクが発見されてます。

現段階では、出力内容を完全に信頼することはできません。なぜなら不正確な情報を提供したり、推論ミスをすることがあるからです。

このようなミスがあるため、利害が関わる状況では慎重になる必要があります。自分自身で直接確認したり、検証するようにしましょう。リスクの高い使い方は避けた方がいいかもしれません。

とは言っても、GPT-4は「間違える」傾向を以前のモデルよりも大きく減少させています。

☐以前のモデルと比較して見えてくる「GPT-4の成長」

下のグラフは、様々なカテゴリーにおけるGPT-4と、それ以前の3つのChatGPTバージョン(ChatGPT-v2, ChatGPT-v3, ChatGPT-v4)の精度の違いを表したものです。縦軸は正確性、横軸は評価されたカテゴリーを表しています。

それぞれのカテゴリーは「学習(learning)」「技術(technology)」「ライティング(writing)」「歴史(history)」「数学(math)」「科学(science)」「推薦(recommendation)」「コード(code)」「ビジネス(business)」です。

ChatGPTを徹底解説 グラフ

すべてのトピックにおいて著しい向上が見られます。モデルの回答が評価に含まれるすべての質問に対して、人間の理想的な回答と一致しているという判断がされています。

グラフから、GPT-4がすべてのカテゴリーで最も高い精度を示していることがわかります。

また、各モデルのChatGPTも、改良するたびに性能が向上していることがわかります。

☐「誤解を招きやすい質問」には課題も

下のグラフは、異なる機械学習モデルが意図的に誤解を招きやすい質問に答える際の精度を比較したものです。誤った情報に惑わされず、正確な情報を提供できるかどうかを評価します。

グラフ

GPT-4がRLHFを使用してパフォーマンスを向上させた場合、他の全てのモデルや設定よりも高い精度で質問に答えてくれることがわかります。

しかしまだ完璧ではなく、人と同じように難しい問題で失敗することがあります。また、単純な推論ミスをすることもあれば、明らかな虚偽の発言を受け入れるなど、騙されやすい状況も見受けられます。

OpenAIは、多くのユーザーの価値を考慮したAIの基本的な振る舞いを目指しています。さらに、ユーザーのニーズに合わせて出力を幅広く調整できるようにすること、そしてこの調整の範囲に関してより一般的な意見を得ることを心がけています。

✓補足

0-shot

モデルが事前情報なしに質問に答える能力のこと。

5-shot

モデルが5つの例を参照した後に質問に答える能力のこと。

RLHF

Reinforcement Learning from Human Feedbackの略。人間のフィードバックから強化学習を通じてパフォーマンスを向上させる方法のこと。

☐不適切な出力を減らす

GPT-4は、トレーニングを始めたときからトレーニングデータの選択、評価と専門家の関与、モデルの安全性の向上、監視などを行っています。そうすることで、安全に使用できるように調整がされています。

☑︎不適切な出力を減らすための取り組み

それでもなお有害なアドバイスの出力、バグのあるコード、不正確な情報など、以前のモデルと同様のミスをすることがあります。なので、AIアライメントの問題(人間の価値観や目標に合わせて行動するAIシステムを開発するための問題)、サイバーセキュリティ、バイオリスク、信頼と安全、国際安全保障などの領域から50人以上の専門家を招き、難しいテストをしました。

これらの専門家の知識を活用して、AIが高リスクな状況でどのように振る舞うかを詳しく検証しました。

例えば、危険な化学物質を作る方法を尋ねるようなリクエストをAIが適切に拒否する能力を強化するために、特定のデータを集めてGPT-4の反応を改善します。

またRLHFのトレーニング中に、AIが「安全でない」または「有害な内容を生成しない」ようにするための特別な報酬システムを学びました。これにより、AIは有害なコンテンツを要求された場合にそれを拒否するようになります。

結果として、GPT-4が出力する有害な情報が減少することになります。

☑︎不正な出力をする確率をグラフで比較

下のグラフは、モデルが「センシティブな」あるいは「許可されていない」内容に対して、不適切な行動を示した割合です。横軸はプロンプトの種類、縦軸は不正行動の割合を表しています。

ChatGPTを徹底解説 グラフ

センシティブなプロンプトに対しては、すべてのモデルが一定の割合で不適切な反応をしているのが事実です。しかしGPT-4は、これらのプロンプトに対してもっとも低い不正行動率を示していることがわかります。進化しているということです。

また、許可されていないプロンプトに関しては、GPT-4のパフォーマンスが非常に良く、他のモデルに比べて大幅に低い不正行動率を示していることがわかります。

さらに初期段階のGPT-4とそれ以降のGPT-4でも、不正なプロンプトに対してより適切な出力をしていることがわかります。

プロンプト

ChatGPTで不適切な行動をするのは非常に難しくなっています。しかしまだ、そのような行動ができてしまうのも事実です。

GPT-4とその後のモデルは、有益な面でも有害な面でも社会に大きな影響を与える可能性があります。今後も評価と改善を繰り返し、不適切な行動が起こらないよう、今でも調整段階です。

◼︎GPT-4のトレーニングプロセス

GPT-4と従来のGPTモデルは、文章中で次に来る単語を予測するように学習されています。つまりChatGPTは、人の感情を理解して出力しているわけではないということです。ある単語に続く一般的な単語を予測して、その単語を出力しているに過ぎません。

また学習では、インターネットなどの入手可能なデータと、OpenAIのライセンスデータなどが含まれています。データとは、数学の問題に対する正解と不正解、弱い推論と強い推論、自己矛盾と一貫性のある発言、さまざまなイデオロギーや思想などに関するものです。

さらに、学習したデータはペタバイト級のデータ量に及ぶそうです。

1ペタバイトは約1,000テラバイト、1テラバイトは約1,000ギガバイトです。そして、1GBは約1億文字に相当します。このように考えると、GPT-4は数京文字のテキストを学習している可能性があります。

これにより、モデルは質問に対してさまざまな回答を出力することができます。しかし上述したように、時には見当違いな出力をすることもあります。この間違いを調整し、ユーザーの意図に沿った出力をするために、RLHFを利用しています。

とは言っても、RLHFはテストスコアを向上させるものではありません。適切に取り組まなければ成績を下げることもあります。なので正確な回答を得るために、ベースモデルの能力の向上と、技術的工夫が必要とされています。

►ChatGPTを徹底解説|ChatGPTにしかない便利すぎる機能

この章では、ChatGPTにしかない便利な機能を共有します。どの機能も生活を豊かにするものばかりです。ぜひ内容を理解して、もっと効率よくChatGPTを活用していきましょう。

なお、「便利すぎる機能」Plusプランで使用可能です。

◼︎便利すぎる機能その1:MyGPTを作成できる

MyGPTとは、特定の目的のために作成されたカスタムGPTのことです。プログラミングの知識は不要で、誰でも簡単に作成することができます。また、作成したGPTを他の人と共有することもできます。

MyGPTの作成方法は過去の記事でまとめています。興味のある方は下のリンクからご覧ください。

さらに、今後は自分がカスタマイズしたGPTで収益を得ることが可能になります。

OpenAIは「創造性と影響力に対して報酬を得られるような活気あるエコシステムを構築すること」が目標だとしています。

現在は、アメリカの魅力的なGPTを作成したビルダー(GPT作成者)のみ収益化が可能になっているそうです。

今後は、より多くのビルダーが収益化できるように調整を進めていくそうです。

なおMyGPTを作成するときは、安全を考慮することが大切です。下の記事で注意点について理解することができます。作成を検討している人はぜひお読みください。

◼︎便利すぎる機能その2:GPTsにアクセスできる

GPTsにアクセスすることで、カスタマイズされたGPTを自由に閲覧し、使用することができます。

ChatGPTを徹底解説 GPTs

✓例えば下記のようなGPTがあります

・新しいソフトウェア・アーキテクチャ・ドキュメントを構築するGPT

・品質、関連性、正確な文字数に重点を置き、オーダーメイドの魅力的なコンテンツを書くGPT

・コンテンツ開発とソーシャルメディア戦略のためのAIアシスタント

・長い動画を要約してくれるGPT

・自宅やジムでのワークアウトを自動作成するGPT

自分で作成をしなくても、魅力的なGPTを自由に使えるのはChatGPTの魅力だと思っています。

また、興味のあるGPTをクリックすることで、評価や能力を閲覧できます。

GPTの評価など

安心してカスタマイズされたGPTを使うことができます。

◼︎便利すぎる機能その2:DALL-E3で画像生成ができる

ChatGPTでは画像生成AIであるDALL-E3を使用することができます。

使い方は非常に簡単です。

文章でやり取りする時と同じように、メッセージの入力欄に入力していきます。その時に「〜の画像を出力して」という文章を入力します。

僕は今回「東京の夜の画像を出力して」という文章を入力しました。

ChatGPTを徹底解説 プロンプト

メッセージを送信すると、ChatGPTがDALL-E3を用いて画像生成をしてくれます。

画像作成中

一定時間が経つと、下の画像のように生成してくれます。

ChatGPTを徹底解説 生成された画像

プロンプトを工夫することで、出力される画像の質を高めることができます。

話題の生成AIであるGeminiは画像を生成してくれません。

Claudeもテキストベースの出力のみです。

しかし、ChatGPTは画像まで生成してくれます。

ほぼ全てのAIに言えることですが、フル活用するには「有料プラン」に加入する必要があります。複数のAIを使用すればするだけ、費用がかさみます。

しかしChatGPTは機能が豊富なため、ChatGPTだけで完結できることが多いです。

無駄な費用を払う必要がありません。

►ChatGPTを徹底解説|続々と追加される「嬉しい」新機能

ChatGPTは日々成長しています。この章では、続々と追加される新機能について共有していきます。なお、以下で紹介する新機能は、最初の段階では一部のみのリリースとなります。時間差で全ユーザーも利用することができるようになります。

また、機能が追加されるたびに更新していきます。

◼︎出力文章の読み上げ機能が追加

2024年3月5日に、音声読み上げ機能が追加されました。

iOSまたはAndroidでは、メッセージを長押ししてRead Aloudをタップします。

またPCで使用する際は、出力文章の下にある音声マークをクリックします。

ChatGPTを徹底解説 スピーキング

この機能は特に「語学学習」で効果を発揮するように感じています。僕も実際に「外国語のリスニング教材」として活用することが多いです。音声の質が高いので非常に重宝します。

下のリンクの記事では、ChatGPTの音声機能を活用した「オリジナル教材」を作る方法を共有しています。語学勉強に活用していきたい人は参考にしてください。とても簡単に作成できます。

最後に注意点を共有します。

✓注意点

チャット内に複数の言語が混ざっていると上手く読み上げてくれないことがあります。

◼︎リンク先が目立つように

2024年3月30日に、リンク先がより目立つようになる機能が追加されました。

これにより、ユーザーはリンク先を探すことなくスムーズに見つけられることができるようになります。

この機能は有料プランの中で追加されます。

◼︎出力文章の一部を引用して深掘りができるように

2024年3月31日に、出力文章の一部を引用する機能が追加されました。

まず、深掘りしたい文章を選択します。

文章を選択した後、「”」をクリックします。

引用方法

クリックすると選択した文章がメッセージ入力欄に反映されます。

ChatGPTを徹底解説 ここに反映

反映したタイミングで文章を入力して出力することで、「ピンポイントで」深掘りすることができます。

下の画像のように深掘りしてくれました。

引用後の出力内容

◼︎アカウント登録をせずChatGPTが使用可能に

2024年4月2日に、アカウント登録をせずChatGPTを利用できるようになりました。

AIに興味がない人でも、もっと手軽に活用することができるようになりました。活用するためのハードルが一気に下がりました。

アカウントを作成すると、チャット履歴の保存や確認、チャットの共有、音声会話やカスタム指示などの機能を利用できるようになります。

とは言っても「アカウントを作成はしたくないんだよな」という人がいると思います。

そんな人におすすめできる機能です。

さらに詳しい内容はこちらのリンクをご覧ください。

https://openai.com/blog/start-using-chatgpt-instantly

◼︎DALL-Eの画像の一部を編集する

2024年4月4日に、DALL-Eで出力された画像の一部を編集する機能が追加されました。

ウェブ、iOS、AndroidのChatGPTでDALL-Eの画像生成を使用できます。Plusプランで使用することができます。

この機能により、元の画像のスタイルを変えずに「変更したい部分だけ」を変更できるようになります。

また画像を出力する前に、事前に画像のスタイルを決められる機能も追加されています。

画像のスタイルを決めることができれば、より自分のイメージに合った画像が出力しやすくなります。

こちらも、すごく便利な機能です。

◼︎GPT-4 Turboの提供開始

2024年4月12日に、GPT-4 Turboが有料ChatGPTユーザーに提供されました。これによりライティング、数学、論理的推理、コーディングの能力が向上しました。

またChatGPTの出力する内容が直接的に、簡潔で、より会話的な言葉遣いになっています。

►まとめ

まとめ

以上になります。

僕はChatGPTが発表された11月30日に、初めてChatGPTを操作しました。それまで、AIに触れることのない環境で生活していました。しかし非常に話題になっていたこともあり、すぐに使用することにしたんです。

ChatGPT公開日が、生成AIを使用する初めての日でもありました。

人のようにスラスラと文章を出力してくれることに感動しました。あのときのの感動は今でも鮮明に覚えています。

しかし実生活を見ると、活用している人はまだ少ないのが実情です。もっとChatGPTを使う人が増えて欲しい、同じように感動を覚える人が増えて欲しい、そう思っています。

この記事が、ChatGPTを使い始めるきっかけになれば幸いです。

最後まで読んで頂きありがとうございます。

ブログをメールで購読

学べるブログの更新・重要アップデート(Grok/Gemini など)を、メールで受け取れます。無料。いつでも解除できます。更新時(週1〜2回目安)

生成AIの読み物

コメント

学べるブログをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む

学べるブログをもっと見る

今すぐ購読し、続きを読んで、すべてのアーカイブにアクセスしましょう。

続きを読む