• Skip to primary navigation
  • Skip to main content

Nagashima Laboratory

  • Home
  • Lecture
  • Note
  • Index
  • About

視覚情報の言語化

視覚情報の言語化

生成AIを用いて、テキストから画像を生成するためには、最終的な出力イメージ(視覚情報)を想像した上でテキストを記述する必要があります。

言語化するということ

自分が表現したいもの、伝えたいものは何かを明確にする、自分の考えを定義すること。整理(区別・分類)すること。

プロンプトエンジニアリング Prompt Engineering

生成AIから目的の出力をさせるための手法のこと。望ましい出力のためには、生成AIが理解できるような指示文章が必要です。そのため、適切な指示方法を設計すること自体が、新しい技術・学術分野となっています。

※プロンプト(prompt):コンピュータの操作画面で入力を促す表示。生成AIに指示をするために入力するテキストのこと。「テキストから画像(Text to image)」を生成するモデルにおいては、希望する画像を説明したテキストがプロンプトになります。

参考:プロンプトエンジニアリング:wikipedia

美術史学におけるディスクリプション(description)

作品記述。絵に描かれている要素を1つ1つ言葉で説明すること

アウトプット鑑賞法

「作品を見て、気がついたことや感じたことを声に出したり、紙に書き出したりして「アウトプット」する」こと。「アート思考(自分の視点で物事を見て、自分の答えを見つける思考方法)」を身につけるための、入り口となる手法として紹介されています。

「13歳からのアート思考」末永幸歩, ダイヤモンド社, 2020 より

演習1:ディスクリプションの実践

参考:Wikipedia Commons

画像を見て「ディスクリプション」をしてみます。画像に描かれている要素を一つ一つ言葉で説明するようにしてください。

Wikipedia Commons:パブリックドメインおよびフリーなライセンスが付与された教育的コンテンツ。各個別のメディアファイルのライセンス状態はそれぞれの説明ページに記載がある。

パブリックドメイン(public domain):著作物や発明などの知的創作物について、知的財産権が発生していない状態または消滅した状態のこと。

Creative Commons License(CC License):インターネット時代のための新しい著作権ルールで、作品を公開する作者が「この条件を守れば私の作品を自由に使って構いません。」という意思表示をするためのツール(https://creativecommons.jp/licenses/より)

基本のプロンプト

  • 場所:どこにいるか
  • 状況:描く対象はどうしているか
  • 対象:何を描くか

※「プロンプトエンジニアリング入門」より

基本的な5W1Hを揃えることを意識すると、状況を説明するための言葉が揃います

修飾語の係り受け

「青い目の大きな犬」という文章があった場合…

  • 青い、目の大きな犬(目が大きく、体が青色の犬)
  • 青い目の、大きな犬(青い目をした、体が大きな犬)

の2つの解釈が可能です。読点で区切ったり「」を付けて、修飾の範囲を制限すると、より正確に伝わるようになります。

演習2:完成目標イメージを決めて画像を生成する

参考:Wikipedia Commons

  1. 画像を見て「ディスクリプション」をする。画像に描かれている要素を一つ一つ言葉で説明する
  2. 作成した言葉(キーワード、記述)をもとにして、画像生成を行う

画像生成AIと著作権

文化庁のガイドラインでは「AI開発・学習段階」と「生成・利用段階」とで分けて考えるとされています。

生成・利用段階では「AIを利用して画像等を生成した場合でも、著作権侵害となるか否かは、人がAIを利用せず絵を描いた場合などの、通常の場合と同様に判断(「類似性」及び「依拠性」によって判断)」します。

  • 類似性:他人の著作物と同一・類似
  • 依拠性:他人の著作物に依拠

参考:

  • AIと著作権に関する考え方(文化庁)2024.3.15
  • Adobe Fireflyの学習コンテンツについて

コンテンツクレデンシャル(Content Credentials)

Adobe Fireflyで生成した画像については、生成AIによって生成された画像であること分かるようにファイル内に情報が記録されています。コンテンツクレデンシャル(Content Credentials)といい、権利の所在や、編集の履歴を記録する機能です。例えば、Adobe FireflyやOpenAIのDALL.Eなどで生成した画像を、Content Credentialsのサイト上にアップロードすることで、認証情報を確認できます。

  • https://contentcredentials.org/verify

参考書籍・サイト

  • 「Web Designing」特集: デザインの言語化, vol.226(2024年6月号),マイナビ出版, 2024
  • 「13歳からのアート思考」末永幸歩, ダイヤモンド社, 2020
  • 「プロンプトエンジニアリング入門」掌田津耶乃, 秀和システム, 2023

2024-05-20 (Last Modified: 2024-05-22) Category: 資料 Tags:copyright, description, generative-ai, prompt-engineerting

Copyright © 2023–2025 · Nagashima Sayuri Laboratory