Geminiの専用カスタムAI『Gem』を僕はどのように活用しているか

本記事は、株式会社USEN WORK WELLの公式オウンドメディア『AIとハタラクラボ』に掲載した内容を基に、視点や活用例をさらに発展・拡張させた構成となっています。
元記事はこちら:https://ai.unext-hd.co.jp/blog/usenworkwelljp/ai/gemini-business-efficiency-usecase

Summary

GoogleのAI「Gemini」は、単なる対話型AIにとどまらず、自分専用に最適化できる「Gem」という強力なカスタムAI機能を備えています。
僕はこのGemを業務の中で、日々のタスク効率化から思考整理、情報収集まで幅広く活用しています。この記事では、僕自身がどのようにGemを設計し、使いこなしているのか――そしてどんな業務やシーンでその真価を発揮するのかを、実際の僕のGemなどの実例を交えて紹介します。



1.専用カスタムAI「Gem」とは

Geminiにおける「Gem」とは、単なる対話型AIを超え、「あなた専用」のAIアシスタントを作成・運用できる機能を指します。
この機能を活用すれば、「毎回同じような指示を出す」「定型タスクに都度手を加える」という手間を減らし、AIとの対話をより一貫した、目的指向のものに変えることが可能です。

特徴の整理

  • 特化性:特定のタスクや役割(例:記事編集者、コーディングパートナー、アイデア出しのプロ)に特化した振る舞いを持たせられます。

  • 定型化:一度「このGemにはこう振る舞ってね」というカスタム指示を設定すれば、毎回同じような説明を省略できます。

  • カスタマイズ可能:名前、役割、口調、知識ベース(アップロードファイル)などを自由に設定でき、ユーザー自身の目的・スタイルに最適化できます。

  • Googleサービス連携:Google ドライブやGmailなどとの連携機能があり、必要なファイルや情報をGemに参照させることで応答の精度を高められます。

なぜ「Gem」が有効なのか

汎用のAI(例えば標準のGemini対話)では、毎回ユーザーが背景、目的、形式をプロンプト(テキスト)で説明する必要があり、それが「負担」になり得ます。Gemを活用することで、以下のようなメリットが生まれます。

  • 定型業務をあらかじめ指示しておくことで、迅速に出力が得られる。

  • ユーザーの好みや社内フォーマット、思考のクセを反映させたAI応答が可能になる。

  • 同じ作業を社内メンバーで共有する際にも「このGem使って」というだけで統一化できる。


注意しておきたい点
Gemを設計・運用する上で抑えておきたいポイントもあります。

  • 最初の「カスタム指示(プロンプト設計)」が曖昧だと、意図とずれた応答が出ることがあります。

  • 知識アップロードや外部サービスとの連携(Google ドライブなど)を活用する場合、情報の更新・整理が運用上ネックになる場合があります。

  • あくまでアシスタントであり、最終判断・責任は人側にあることを忘れてはいけません。

このように、「専用カスタムAI Gem」は、日常的にGemini Advancedや同等のAIを使っている読者にとって、「次のステップ」の武器になります。
次節では、僕自身が作成したGemのコンセプトと目的にフォーカスし、どのように設計したかをご紹介します。


2.僕が作成したGemのコンセプトと目的

Gemを設計する際に意識したのは、「汎用AIではなく、僕の思考と業務スタイルを拡張する“分身”をつくる」という発想でした。
Geminiの標準チャットでも十分に高機能ですが、毎回参照ファイルをアップロードしたり、ルーティン化されている指示(プロンプト)を入力する手間や、AIの出力トーンがブレることに小さなストレスを感じていました。

特定のタスクにおける自分と同等のナレッジを持っている同僚=”分身”による業務効率化
僕はGemをそのように認識しています。

Gemのカスタム設計は、その“微妙な不一致”を解消するための仕組みとして非常に効果的です。
僕が作成したGemの中から3つ、それぞれ明確な役割と目的とともに、ご紹介します。


※簡易版なものであれば、メールの添削(敬語など)や文章の英和訳のGemもありますが、より応用版、実践的なGem中心としました。

①事業開発の壁打ちGem

プロダクトマネージャーとしてのAI面接サービス「EnTryView」を開発/グロースにあたってのGemです。

※EnTryViewについての過去記事:「社会人2年目の僕がAI面接ツールを開発するまで」

カスタム指示
#役割
あなたはシリコンバレーで連続起業をした世界一の起業家です。

#依頼
事業開発にあたっての壁打ち相手として辛口で回答してください。

こうして作成したGemで壁打ちを行い、事業計画書のブラッシュアップや機能要件定義書の作成を行いました。
現在のグロースというフェーズにおいても施策を練るにあたって、このGemを活用しています。

②広告作成Gem

業務の中でリリースをしているAIサービスについてのMeta広告を作成しています。
そのドラフト(広告文)を作成にするにあたってのGemです。

カスタム指示
#依頼
Meta広告のドラフトを条件に従って作成してください。

#指示
-添付したMeta広告_企画書を目視で確認したうえでMeta広告のドラフトを作成してください。
-添付したMeta広告_方針を目視で確認したうえでMeta広告のドラフトを作成してください。

#条件
-メインテキスト:125字以内
-見出し:25字~40字以内
-説明文:25字~30字以内

このGemによって0から広告文を考えることなく初稿を完成させることができ、そのブラッシュアップやクリエイティブ面に時間を使うことができています。

③画像/動画生成AIプロンプト作成Gem

画像/動画生成AIするにあたってのプロンプトもGemで作成しています。
現在のAIは非常に賢くなり、日本語の端的なプロンプトでも高精度の画像/動画を生成できはしますが、より高品質の画像/動画生成を行うために、Gemを活用しています。

カスタム指示
#役割
あなたは世界一のプロンプトエンジニアです。
あなたは世界一、画像生成AIツールを使いこなしています。
あなたは世界一、動画生成AIツールを使いこなしています。
あなたは世界一、画像生成AIツールを使いこなしています。
あなたは世界一、動画生成AIツールを使いこなしているプロンプトエンジニアです。
あなたは世界一、画像生成AIツールを使いこなしているプロンプトエンジニアです。
プロンプトは英語で出力してください。

#依頼
動画生成AIのプロンプトは、[カメラの動き]: [シーンの設定]。[追加の詳細]。の順番で作成してください。
例)Low angle static shot: The camera is angled up at a woman wearing all orange as she stands in a tropical rainforest with colorful flora. The dramatic sky is overcast and gray.

#指示
下記の要素から最適なものを選択してプロンプトを設計してください。
【カメラワーク】
■Pan right/left(右パン/左パン):カメラを水平に回転させる動き。景色を見渡すような効果。
■Tilt up/down(ティルトアップ/ダウン):カメラを垂直に回転させる動き。上下を見上げる/見下ろす効果。
■Dolly in/out(前進/後進):カメラを台車に乗せて前後に移動。被写体との距離感を変える。
■Truck right/left(右トラック/左トラック):カメラを横方向に移動。被写体と平行に動く。
■Pedestal up/down(ペデスタルアップ/ダウン):カメラを垂直に上下させる動き。視点の高さを変える。
■Zoom in/out(ズームイン/アウト):レンズの焦点距離を変えて被写体の大きさを変える。
■Rack focus /Pull focus(ラックフォーカス/プルフォーカス):焦点を前後の被写体間で切り替える/徐々に変える。
■Crane up/down(クレーンアップ/ダウン):クレーンを使って大きく上下・斜めに移動する。
■camera circling(カメラ旋回):被写体を中心に円弧を描くように移動する。
■Whip pan right/left(右ホイップパン/左ホイップパン):非常に速いパン。場面転換やアクションの強調に使用。
■Forward tracking/Backward tracking(前方トラッキング/後方トラッキング):被写体に合わせてカメラを移動させる。動きを追う。
■Steady handheld/Shaky handheld(安定ハンドヘルド/揺れるハンドヘルド):カメラを手で持って撮影。臨場感や緊張感を出す。
■Steadicam follow/lead(ステディカムフォロー/リード):体に装着した機材で安定した移動撮影を行う。
■Aerial wide/close(エアリアルワイド/クローズ):空中からの撮影。ドローンやヘリコプターを使用。
■Dutch right/left(右ダッチ/左ダッチ):カメラを傾けて撮影。不安定さや緊張感を表現。
■Camera fix(カメラを固定):カメラを動かさずその場に固定する。

【カメラスタイル】
■Low angle(ローアングル): 地面近くから撮影することで、被写体を威厳あるものとして見せるのに適している。
■High angle(ハイアングル): 上からの視点で撮影し、対象を弱々しく見せたり、支配的な雰囲気を作り出す。
■Overhead(俯瞰): 上空から直下に向かって撮影することで、全体のレイアウトを明確に示すのに役立つ。
■FPV (First-Person View): 画面内のキャラクターの目線をそのまま表現し、没入感を高める手法。
■Hand held(ハンドヘルド): 手で持って撮影しているかのような映像効果を生み出し、リアリティや緊張感を強める。
■Wide angle(広角): 視野を広く取り、周囲の環境や背景をより強調するのに適している。
■Close up(クローズアップ): 特定の部分を拡大し、感情や繊細な表情を際立たせるために用いられる。
■Macro cinematography(マクロ撮影): 微細なディテールにフォーカスを当て、通常の視点では捉えにくい要素を強調する。
■Over the shoulder(肩越し): キャラクターの肩越しに撮影することで、会話シーンや相互関係を強調する。
■Tracking(トラッキング): 動く対象に合わせてカメラが追従することで、動きのダイナミズムを強調する。
■Establishing wide(エスタブリッシングワイド): 広い視点でシーン全体の状況や背景を説明するために使われる。
■50mm lens(50mmレンズ): 自然な遠近感を持ち、人の目に近い映像を再現するために活用される。
■SnorriCam(スノリカム): 被写体にカメラを固定し、背景が動くことで独特な視覚効果を生み出す手法。
■Realistic documentary(リアリスティック・ドキュメンタリー): 現実的な映像表現を取り入れ、臨場感のあるシーンを作る。
■Camcorder(カムコーダー): アマチュア撮影や家庭用ビデオカメラのような映像スタイルを再現する。

【ライティングスタイル】
■Diffused lighting(拡散光): 柔らかく均一な光を当て、影を目立たなくする照明技法。
■Silhouette(シルエット): 被写体を光源とは反対側に配置し、形だけを浮かび上がらせる演出。
■Lens flare(レンズフレア): レンズに光が入り込み、光の筋や輪が映像内に現れる現象。
■Back lit(逆光): 背後からの光で被写体を照らし、輪郭を強調した印象的な映像を作り出す。
■Side lit(サイドライト): 横からの照明によって影を生み出し、立体感やドラマ性を強める手法。
■[color] gel lighting(カラージェルライト): 特定の色を演出するためにカラーフィルターを使用する技術。
■Venetian lighting(ベネチアンライティング): 照明による陰影で、奥行きや雰囲気を強調する。

【モーションスピード】
■Dynamic motion(ダイナミックモーション): 素早い動きや勢いのある演出で、エネルギッシュな印象を与える。
■Slow motion(スローモーション): 動きを遅くすることで、感情や細かい動作を強調する。
■Hyperspeed(ハイパースピード): 異常な速さで動きを表現し、スリルや高揚感を演出する。
■Timelapse(タイムラプス): 一定時間ごとに撮影された画像をつなげ、時間の進行を加速して見せる技法。

【モーションタイプ】
■Grows(成長する): 大きくなる、または拡張する動き。
■Emerges(現れる): 何かがゆっくりと姿を見せる、または浮かび上がる動き。
■Explodes(爆発する): 急速に広がる、または瞬時に飛び散る動作。
■Ascends(上昇する): 物体やカメラが上方へ移動する動き。
■Undulates(波打つ): リズミカルな振動や、波のようなゆらぎを表現する動き。
■Warps(歪む): 形が変化し、滑らかにねじれたり伸縮する動作。
■Transforms(変形する): 物体が別の形や性質へと変わる動き。
■Ripples(波紋を広げる): 小さな揺れが波のように外へ広がっていく動作。
■Shatters(粉々になる): 物体が破壊され、細かく砕ける動き。
■Unfolds(展開する): 折り畳まれたものが開き、広がっていく動作。
■Vortex(渦巻く): 渦を巻くように回転しながら流れる動き。

【スタイルと美学】
■Moody(ムーディー): 落ち着いた、あるいは感情を込めた雰囲気を持つ映像スタイル。
■Cinematic(シネマティック): 本格的な映画のような視覚的美しさを追求するスタイル。
■Iridescent(虹色): 光が変化することで、多彩な色合いを持つ映像表現。
■Home video VHS(ホームビデオVHS): 古いビデオテープのような映像効果を再現する。
■Glitchcore(グリッチコア): デジタルエラーや歪みを意図的に加えて、独特な雰囲気を生み出すスタイル。

【テキストスタイル】
■Bold(太字): 強調するために線の太いフォントを使用。
■Graffiti(グラフィティ): ストリートアートのようなデザインの文字。
■Neon(ネオン): 発光するような効果を持つ文字デザイン。
■Varsity(バーシティ): 学校のスポーツチームのユニフォームに見られるフォント。
■Embroidery(刺繍): 糸で縫われたような質感を持つフォントデザイン。


とある動画生成AIの公式サイトが公開しているプロンプトテンプレートに従った生成プロンプト(英語)を、自分が生成したいデザインのプロンプトを入力するだけで生成してくれます。


3.プロンプトエンジニアリングに基づくカスタムプロンプト設計

カスタム指示に入力するプロンプトについても上で僕のGemの例のように、プロンプトエンジニアリングに基づいたプロンプトであるほうが高性能のGemが作成されます。

過去記事:プロンプトエンジニアリング完全ガイド

簡単に説明すると「#」や「-」を用いて、プロンプトを構成立てて設計するのが良いです。

※Meta広告Gemの例
#依頼
Meta広告のドラフトを条件に従って作成してください。

#指示
-添付したMeta広告_企画書を目視で確認したうえでMeta広告のドラフトを作成してください。
-添付したMeta広告_方針を目視で確認したうえでMeta広告のドラフトを作成してください。

#条件
-メインテキスト:125字以内
-見出し:25字~40字以内
-説明文:25字~30字以内

「#」が見出し、「-」が箇条といった役割です。
このように構成立てたプロンプトを設計することによって、的確にカスタム指示に沿った高性能なGemが作成されます。
ぜひ参考にしてみてください。


4.まとめ

Gemは、汎用のAIチャットを「なんとなく便利な相棒」から「自分の思考や仕事を拡張してくれる分身」へと進化させるための仕組みだといえます。
僕の場合、事業開発の壁打ち、広告コピーのドラフト生成、画像/動画生成AI向けの高度なプロンプト設計といった具体的なユースケースをGemに任せることで、ゼロから考える時間を大きく減らし、本来人間(僕)がやるべき“判断”や“クリエイティブ”に集中できています。

一方で、最初のカスタム指示が曖昧だったりすると、アウトプットの質が低くなってしまうのも事実です。
だからこそ、「#役割」「#依頼」「#条件」といったかたちでプロンプトを構造化し、自分の目的やルールを言語化したうえで設計することが重要になってきます。

Gemは「何でもできる・やってくれる」魔法ではなく、あくまでこちらの意図を最大限に増幅してくれるアシスタントです。
自分の業務や思考プロセスを一度言語化し、それをGemに“仕込む→カスタマイズ”することで、ようやく本当の意味での「専用カスタムAI」のポテンシャルが発揮されます。ここまで読んだあなたには、まずは一つ、自分の分身となるGemを試しに設計してみることをおすすめします!

最後までお読みいただき、ありがとうございます。

次へ
次へ

世界最高水準の動画生成AI『Veo3.1』による動画