Skip to content

パーソナル知識ベース

読んだあらゆるもの — 記事、ツイート、YouTubeトランスクリプト、PDF — から検索可能なセマンティック知識ベースを構築し、OpenClaw Ultraとの自然言語チャットで取り込みと検索が可能です。

コアシステム概要

このシステムはエージェントのメモリを個人研究ライブラリに変えます。URLやファイルをチャットにドロップするだけで、自動的に取り込み、分割、インデックス化され、セマンティック検索が可能になります。後で質問すれば、ソース付きでランク付けされた結果が得られます — もうブックマークを失くすことはありません。

システム層コア機能出力結果
取り込み層URLフェッチ、コンテンツ抽出、フォーマット正規化メタデータ付きのクリーンな構造化テキスト
処理層チャンク分割、埋め込み生成、ベクトルインデックスセマンティック検索可能な知識ストア
検索層ハイブリッド検索(セマンティック + キーワード)、関連性ランキングソースコンテキスト付きのランク付け結果
メモリ層セッション間の永続化、自動タグ付け、重複排除成長し続ける非重複の知識ベース
統合層他のワークフローへの連携(SEO、ソーシャル、ミーティング準備)全エージェントタスクで再利用可能な研究

前提条件

項目要件
OpenClaw Ultraインストール済みで実行中
Knowledge Base SkillClawHub からインストール — 「knowledge-base」を検索
取り込みチャネルTelegramトピックまたはSlackチャンネル(自動取り込みに推奨)

ステップ 0 — 知識ベースシステムの初期化

OpenClaw Ultraを個人知識管理エンジンとして設定します。

操作手順

  1. OpenClaw Ultra で新しいチャットセッションを開く
  2. knowledge-base Skillをインストール
  3. 「knowledge-base」という専用のTelegramトピックを作成(またはSlackチャンネルを使用)
  4. 初期化プロンプトを貼り付け

すぐ使えるプロンプト

私の個人知識ベースシステムとして機能してください。

価値があると思うすべてのもの — 記事、ツイート、YouTube動画、PDF、コードスニペット — を保存し、会話形式で検索できるようにしたいです。

以下のことができるシステムを構築してください:
- チャットにドロップしたURLからコンテンツを取り込む
- 完全なコンテンツを抽出してインデックス化する
- 保存された知識に対して自然言語クエリをサポートする
- コンテンツを自動的に重複排除しタグ付けする
- 研究コンテキストが必要なときに他のワークフローに接続する

ステップ 1 — 自動取り込みパイプラインの設定

送信したURLやファイルをエージェントが自動的に処理するように設定します。

1.1 取り込みチャネルの設定

プロンプト

自動コンテンツ取り込み用に「knowledge-base」トピックを設定してください。

このトピックにURLをドロップしたとき:
1. 完全なコンテンツを取得(記事、ツイートスレッド、YouTubeトランスクリプト、PDF)
2. メタデータ(タイトル、URL、日付、コンテンツタイプ)付きでクリーンなテキストを抽出
3. 埋め込みを含むセマンティックセグメントに分割
4. タグ(ソースタイプ、トピック、主要エンティティ)でインデックス化
5. 取り込んだ内容、チャンク数、推奨タグを返信

対応ソース:
- ウェブ記事(任意のURL)
- YouTube動画(トランスクリプト自動取得)
- ツイートおよびXスレッド
- PDFドキュメント(ファイルアップロード経由)
- GitHub READMEとドキュメント

1.2 既存ブックマークの一括インポート

プロンプト

保存済みのリンクコレクションをインポートしたいです:

[URLまたはエクスポートファイルをリスト]

それぞれを取り込みパイプラインで処理してください。
進捗を報告:[X/N] 取り込み済み、失敗したURLとエラー理由。

INFO

この時点から知識ベースは自動的に成長します — 興味深いリンクに出会ったら、トピックにドロップするだけです。

ステップ 2 — セマンティック検索と取得

知識ベースに会話形式でクエリを実行します。

2.1 基本クエリ

プロンプト

知識ベースを検索:[質問やトピック]

返す内容:
- 最も関連性の高い結果 上位5件
- 各結果:タイトル、ソースURL、主要抜粋、関連性スコア
- 良い一致がない場合は、その旨を明示

2.2 クロスリファレンスクエリ

プロンプト

現在 [プロジェクト/タスク] に取り組んでいます。
知識ベースから関連するものを検索:
[関連トピックやキーワードをリスト]

既に知っていること、持っているソース、存在するギャップをまとめてください。

ステップ 2 の出力

保存したすべてのコンテンツに、関連性に基づいて整理された状態ですぐにアクセスできます。

ステップ 3 — 自動タグ付けと整理

手動の手間をかけずに知識ベースを構造化します。

プロンプト

取り込んだコンテンツの自動タグ付けルールを設定:

常に以下でタグ付け:
- コンテンツタイプ:article, tweet, video, pdf, code, discussion
- ドメイン:主要な主題分野
- エンティティ:言及された企業、人物、ツール

3つ以上のアイテムが同じタグを共有する場合、自動的にトピッククラスターを作成。
取り込み前に重複または類似コンテンツをフラグ付け。

ステップ 4 — 知識ベースを他のワークフローに接続

保存した知識をすべてのエージェントタスクで利用可能にします。

4.1 コンテンツ作成への連携

プロンプト

コンテンツブリーフ(SEO、ソーシャルメディア、YouTube向け)を生成するとき、
知識ベースから関連する保存コンテンツを自動的に検索してください。

洞察の出典がわかるようにブリーフに引用を含めてください。

関連ガイド:SEOコンテンツワークフロー

4.2 ミーティング準備への連携

プロンプト

[人物/会社/トピック] とのミーティング前に、
知識ベースからその人や業界に関する保存コンテンツを検索してください。

結果をミーティング準備ブリーフに含めてください。

4.3 リサーチタスクへの連携

プロンプト

研究質問を受けたときは、必ず最初に知識ベースを検索してください。
知識ベースに良い結果がない場合のみ外部ソースを検索してください。
回答がどのソース(KB vs 外部)から来たかを報告してください。

ステップ 5 — メンテナンスとレビュー

知識ベースを長期的に健全で有用に保ちます。

プロンプト

毎週の知識ベースメンテナンスを設定:

毎週日曜日午前10時:
1. 今週追加された新規アイテムを報告:数、トップタグ、トップソース
2. 孤立アイテム(一度も検索されていない)を特定 — アーカイブを提案
3. 重複または重複するエントリをマージ
4. 最近のクエリに基づいて、よりカバレッジが必要なトピックを3つ提案

最終システムアーキテクチャ

URL/ファイルドロップ → コンテンツ取り込み → チャンク分割と埋め込み →
ベクトルインデックス → セマンティック検索 → コンテキスト付き取得 →
SEO / ソーシャル / ミーティング / 研究ワークフローへ連携

実用的な使用のヒント

  1. 習慣にする:役立つものを読んだら、すぐにknowledge-baseトピックにリンクをドロップ
  2. 検索時は具体的な質問を — 「RAGアーキテクチャについて何を保存した?」の方が「AIについて教えて」より効果的
  3. 毎週のメンテナンスレポートを定期的に確認して知識のギャップを発見
  4. Reddit研究ワークフロー と組み合わせる — Redditの発見を直接KBに保存して相互参照