パーソナル知識ベース
読んだあらゆるもの — 記事、ツイート、YouTubeトランスクリプト、PDF — から検索可能なセマンティック知識ベースを構築し、OpenClaw Ultraとの自然言語チャットで取り込みと検索が可能です。
コアシステム概要
このシステムはエージェントのメモリを個人研究ライブラリに変えます。URLやファイルをチャットにドロップするだけで、自動的に取り込み、分割、インデックス化され、セマンティック検索が可能になります。後で質問すれば、ソース付きでランク付けされた結果が得られます — もうブックマークを失くすことはありません。
| システム層 | コア機能 | 出力結果 |
|---|---|---|
| 取り込み層 | URLフェッチ、コンテンツ抽出、フォーマット正規化 | メタデータ付きのクリーンな構造化テキスト |
| 処理層 | チャンク分割、埋め込み生成、ベクトルインデックス | セマンティック検索可能な知識ストア |
| 検索層 | ハイブリッド検索(セマンティック + キーワード)、関連性ランキング | ソースコンテキスト付きのランク付け結果 |
| メモリ層 | セッション間の永続化、自動タグ付け、重複排除 | 成長し続ける非重複の知識ベース |
| 統合層 | 他のワークフローへの連携(SEO、ソーシャル、ミーティング準備) | 全エージェントタスクで再利用可能な研究 |
前提条件
| 項目 | 要件 |
|---|---|
| OpenClaw Ultra | インストール済みで実行中 |
| Knowledge Base Skill | ClawHub からインストール — 「knowledge-base」を検索 |
| 取り込みチャネル | TelegramトピックまたはSlackチャンネル(自動取り込みに推奨) |
ステップ 0 — 知識ベースシステムの初期化
OpenClaw Ultraを個人知識管理エンジンとして設定します。
操作手順
- OpenClaw Ultra で新しいチャットセッションを開く
- knowledge-base Skillをインストール
- 「knowledge-base」という専用のTelegramトピックを作成(またはSlackチャンネルを使用)
- 初期化プロンプトを貼り付け
すぐ使えるプロンプト
私の個人知識ベースシステムとして機能してください。
価値があると思うすべてのもの — 記事、ツイート、YouTube動画、PDF、コードスニペット — を保存し、会話形式で検索できるようにしたいです。
以下のことができるシステムを構築してください:
- チャットにドロップしたURLからコンテンツを取り込む
- 完全なコンテンツを抽出してインデックス化する
- 保存された知識に対して自然言語クエリをサポートする
- コンテンツを自動的に重複排除しタグ付けする
- 研究コンテキストが必要なときに他のワークフローに接続するステップ 1 — 自動取り込みパイプラインの設定
送信したURLやファイルをエージェントが自動的に処理するように設定します。
1.1 取り込みチャネルの設定
プロンプト
自動コンテンツ取り込み用に「knowledge-base」トピックを設定してください。
このトピックにURLをドロップしたとき:
1. 完全なコンテンツを取得(記事、ツイートスレッド、YouTubeトランスクリプト、PDF)
2. メタデータ(タイトル、URL、日付、コンテンツタイプ)付きでクリーンなテキストを抽出
3. 埋め込みを含むセマンティックセグメントに分割
4. タグ(ソースタイプ、トピック、主要エンティティ)でインデックス化
5. 取り込んだ内容、チャンク数、推奨タグを返信
対応ソース:
- ウェブ記事(任意のURL)
- YouTube動画(トランスクリプト自動取得)
- ツイートおよびXスレッド
- PDFドキュメント(ファイルアップロード経由)
- GitHub READMEとドキュメント1.2 既存ブックマークの一括インポート
プロンプト
保存済みのリンクコレクションをインポートしたいです:
[URLまたはエクスポートファイルをリスト]
それぞれを取り込みパイプラインで処理してください。
進捗を報告:[X/N] 取り込み済み、失敗したURLとエラー理由。INFO
この時点から知識ベースは自動的に成長します — 興味深いリンクに出会ったら、トピックにドロップするだけです。
ステップ 2 — セマンティック検索と取得
知識ベースに会話形式でクエリを実行します。
2.1 基本クエリ
プロンプト
知識ベースを検索:[質問やトピック]
返す内容:
- 最も関連性の高い結果 上位5件
- 各結果:タイトル、ソースURL、主要抜粋、関連性スコア
- 良い一致がない場合は、その旨を明示2.2 クロスリファレンスクエリ
プロンプト
現在 [プロジェクト/タスク] に取り組んでいます。
知識ベースから関連するものを検索:
[関連トピックやキーワードをリスト]
既に知っていること、持っているソース、存在するギャップをまとめてください。ステップ 2 の出力
保存したすべてのコンテンツに、関連性に基づいて整理された状態ですぐにアクセスできます。
ステップ 3 — 自動タグ付けと整理
手動の手間をかけずに知識ベースを構造化します。
プロンプト
取り込んだコンテンツの自動タグ付けルールを設定:
常に以下でタグ付け:
- コンテンツタイプ:article, tweet, video, pdf, code, discussion
- ドメイン:主要な主題分野
- エンティティ:言及された企業、人物、ツール
3つ以上のアイテムが同じタグを共有する場合、自動的にトピッククラスターを作成。
取り込み前に重複または類似コンテンツをフラグ付け。ステップ 4 — 知識ベースを他のワークフローに接続
保存した知識をすべてのエージェントタスクで利用可能にします。
4.1 コンテンツ作成への連携
プロンプト
コンテンツブリーフ(SEO、ソーシャルメディア、YouTube向け)を生成するとき、
知識ベースから関連する保存コンテンツを自動的に検索してください。
洞察の出典がわかるようにブリーフに引用を含めてください。関連ガイド:SEOコンテンツワークフロー
4.2 ミーティング準備への連携
プロンプト
[人物/会社/トピック] とのミーティング前に、
知識ベースからその人や業界に関する保存コンテンツを検索してください。
結果をミーティング準備ブリーフに含めてください。4.3 リサーチタスクへの連携
プロンプト
研究質問を受けたときは、必ず最初に知識ベースを検索してください。
知識ベースに良い結果がない場合のみ外部ソースを検索してください。
回答がどのソース(KB vs 外部)から来たかを報告してください。ステップ 5 — メンテナンスとレビュー
知識ベースを長期的に健全で有用に保ちます。
プロンプト
毎週の知識ベースメンテナンスを設定:
毎週日曜日午前10時:
1. 今週追加された新規アイテムを報告:数、トップタグ、トップソース
2. 孤立アイテム(一度も検索されていない)を特定 — アーカイブを提案
3. 重複または重複するエントリをマージ
4. 最近のクエリに基づいて、よりカバレッジが必要なトピックを3つ提案最終システムアーキテクチャ
URL/ファイルドロップ → コンテンツ取り込み → チャンク分割と埋め込み →
ベクトルインデックス → セマンティック検索 → コンテキスト付き取得 →
SEO / ソーシャル / ミーティング / 研究ワークフローへ連携実用的な使用のヒント
- 習慣にする:役立つものを読んだら、すぐにknowledge-baseトピックにリンクをドロップ
- 検索時は具体的な質問を — 「RAGアーキテクチャについて何を保存した?」の方が「AIについて教えて」より効果的
- 毎週のメンテナンスレポートを定期的に確認して知識のギャップを発見
- Reddit研究ワークフロー と組み合わせる — Redditの発見を直接KBに保存して相互参照