name: "hatena-blog-markdown-extractor" description: "Extract content from Hatena Blog article URLs and convert to Markdown format with frontmatter. Preserves images as absolute URLs and removes sidebars, headers, footers, and ads."
Hatena Blog Markdown Extractor
はてなブログの記事URLからコンテンツをMarkdown形式で抽出するスキルです。
機能
- はてなブログの記事URLから本文を抽出
- HTML → Markdown変換
- 画像URLをフルパス(絶対パス)で保持
- サイドバー、ヘッダー、フッター、広告などの不要な要素を自動除去
- フロントマター付きMarkdownファイルを生成
使用方法
# 単一のURLから抽出
/hatena-md <記事URL>
# カスタム出力ディレクトリを指定
/hatena-md <記事URL> <出力ディレクトリ>
例
# デフォルトの出力先 (./hatena-posts/) に保存
/hatena-md https://www.simple-web-system.work/entry/2024/10/17/223212
# カスタム出力先に保存
/hatena-md https://www.simple-web-system.work/entry/2024/10/17/223212 ./my-posts
出力形式
抽出されたMarkdownファイルには以下のフロントマターが付きます:
---
title: "記事タイトル"
url: https://www.simple-web-system.work/entry/2024/10/17/223212
extracted: 2025-10-27T09:46:00.000Z
---
記事本文...
出力先
- デフォルト:
./hatena-posts/ - ファイル名: 記事タイトル.md (特殊文字は除去・置換されます)
注意事項
- Node.jsプロジェクトとしてセットアップされている必要があります
- 実行前に
npm installとnpm run buildを実行してください