だいず出版
写真の裏にあるスクリーンショット(フリーペーパー)
ウェブ
技書博 13
B5判, 2ページ

個人開発している画像検索エンジン『Phonno』の運用を続け、AIエージェント時代の新たな可能性を見出している話です。位置情報のないスクリーンショットを、同時間帯の写真や撮影時刻を手がかりに場所へ接地させる仕組みを通して、写真・スクリーンショット・OCR・緯度経度情報が時刻で重なったときに立ち上がる記憶の検索体験を紹介します。

実世界Yield、実世界Directory(フリーペーパー)
ウェブ
技書博 13
B5判, 2ページ

紙やデジタル世界の概念が街角に立ち現れる瞬間を集める「実世界で触れる」シリーズ番外編。サンフランシスコ滞在中に出会ったYIELDの標識やDIRECTORYの看板から、JavaScriptのyieldやUnixのlsを再発見する。コードの中のキーワードを観光地で味わう旅行記。

LLM時代の検索を考える観察日記 Ⅱ
技術書典 18
B5判, 56ページ

大規模言語モデル(LLM)が私たちの情報探索のあり方を根底から揺るがし始めた時代。ソフトウェアエンジニアである著者が、その変化の渦中でLLMといかに向き合い、理解を深めてきたかの記録を綴った「観察日記」の第二弾です。

本書では、前作の2023年末から2025年初頭にかけて、ChatGPT、Gemini、Perplexity、NotebookLMといった主要なLLMサービスが遂げた進化の過程を、具体的な利用体験やAPI活用の試みと共に丹念に追いかけます。先行サービスの観察から得られる手掛かり、自ら行った実験、そして開発者としての視点から見たUI/UXへの考察など、LLMを実用的なツールとして捉えようとする思考プロセスを共有します。急速に変化するLLM時代の検索の「今」を、スナップショットとしてお届けする一冊です。

LLM時代のメールマガジンとPersonalized AI Agentの探究(フリーペーパー)
ウェブ
技書博 11
B5判, 4ページ

個人開発中のAIメールクライアント『MailLM』の紹介です。Gmail APIとCloud Pub/Sub、Vertex AI(Gemini)を組み合わせ、メールを介してLLMと対話する仕組みをつくりました。チャットUIに頼らないメルマガ生成や、自発的に話しかけてくるパーソナライズドAIエージェントの可能性を技術構成と実装の勘所から探ります。

創造的な年代記エディタの開発と活用法(フリーペーパー)
ウェブ
技書博 10
B5判, 1ページ

個人開発中の年代記エディタ『Chronicle』の概要と活用例の紹介です。マルチカラム表示で異なるテーマの年表を共通時間軸に並べて比較でき、柔軟な粒度の時間表現と自動ソートで直感的に書ける時間GUIを探究します。歴史の学習や読書支援、予定管理まで、サーバログから世界史までを同じ道具で扱う活用法を解説します。

LLM時代の検索を考える観察日記
B5判, 60ページ

ソフトウェアエンジニアとして生成AI(LLM)に慣れるための試行錯誤の記録と、身近な情報検索サービスでの応用例の観察記録です。

新しい技術を使いこなすには手を動かして小さな学びを積み上げていくしかない。この一心で、昨年冬のChatGPTの登場から現在に至るまでの約一年の間、大規模言語モデルに慣れるために観察とAPI活用の実践を重ねてきました。せっかくなのでこれらの取り組みを書き残しておこうというモチベーションで執筆が始まった一冊です。本書では、機械学習を専門としないソフトウェアエンジニアの立場として、先行サービスの観察による手掛かりの発見、未知の技術に対する勘を養うための実験、自身が開発するプロダクトへのLLMの効果的な適用方法、高度な技術のより良く見せるUIについて考えてきたことを共有するのを目指します。

知的生産のための画像検索システム開発記
B5判, 36ページ

知的生産を支援する検索システムを作っている話です。最近ブームな大規模言語モデルのAPIを活用した機能も解説します。マルチモーダルな画像検索とチャットの融合を考えます。

Phonno = Photos + Annotations は興味関心事を発見する画像検索システムです。ウェブアプリケーションとして開発・運用されています。現時点では筆者だけが使える完全プライベートなツールですが、一年以上のドッグフーディングを経てコンセプトも磨きがかかり、だいぶ仕上がってきました。一般公開の機運も高まってきているので、これに先駆けてこだわりの機能の紹介と設計を解説します。自分だけの検索エンジンを作ろうと考えている読者の皆さんの参考になることを願っています。

Pixel Fold 活用日記(フリーペーパー)
ウェブ
技書博 9
B5判, 2ページ

Googleの折りたたみスマホ『Pixel Fold』を購入した二人のエンジニアによる活用日記です。スマホとタブレットを1台で兼ねる利点と欠点を率直に語り、電子書籍や動画視聴、自撮りといった日常使いから、技術書やソースコードを読む、Colabで軽く実験するといった開発者ならではの使い方までを紹介します。

写真を点描画ふうに変換するツールをつくる
B5判, 64ページ

写真を味わいのあるモノクロ点描画に変換するプログラムができました。

本書では、画像を点描画ふうに変換するツール開発の製作過程をまとめました。前半部は、OpenCVを用いて画像処理を行う話がメインです。Colaboratory上で軽く実験を行って必要な設計を洗い出し、Pythonでコードを書いていきます。よく知られた画像処理手法を組み合わせて、手描き感を醸し出す点描画を生成するCLIツールを作ります。後半では、筆者もこのたび初めて触ったGoogle Cloud Run環境でウェブアプリとして動かすところまで持っていきます。

個人開発記として気楽に読んでいただければ幸いです。

点描画に変換するツールの全体像(フリーペーパー)
B5判, 2ページ

写真やスクリーンショットをモノクロ点描画ふうに変換するツールの全体像を紹介します。グレースケール化、ヒストグラム平坦化、二値化、点描パターンによる塗りつぶしという一連の処理を解説し、ローカルのCLIツールからGoogle Cloud RunによるWeb API化までを通して味わいのある変換結果を目指します。

入門GUI(商業誌・共著)
ウェブ
B5判, 92ページ

本書は、Web ブラウザにおける本格的な GUI の入門書です。

Web ブラウザに期待される役割は年々増してきています。ネイティブアプリ顔負けのデザインツールや、ドラッグアンドドロップでの操作が必要なフォームを作りたくなったとして、我々は何に気をつけるべきなのでしょうか?これまで HTML / CSS / JavaScript で実装するのが大変だった UI をどう実装するべきなのでしょうか?この点を本書は重点的に扱います。本書では定番のセレクトボックスやヘッダーレイアウトの他、バウンディングボックスやツリーといったドラッグを伴う UI なども実装していきます。苦しくも楽しい、Webブラウザの複雑なGUIの世界に、エディタとブラウザを開きながら足を踏み入れてみましょう。

探究 SVGとスクリーンショット(商業誌)
ウェブ
B5判, 82ページ

本書は、SVG(Scalable Vector Graphics)とスクリーンショットについてまとめたものです。

SVGの少し変わった使い方やウェブブラウザでのスクリーンショットの撮影と活用に興味がある、ウェブページをまるごと保存したい、高解像度ディスプレイで撮られたPNG形式のスクリーンショット画像の実寸サイズの取得方法を知りたい方を対象としています。

探究 SVGとスクリーンショット
ウェブ
技書博 2
B5判, 72ページ

リンクや GIF 動画も含められる、SVG を用いたスクリーンショットのアイデアの紹介します。

▼SVG Screenshot の開発記: 日々のドッグフーディングで改良を重ねる、趣味開発のモチベーションをお届け! ▼DPI を考慮して画像を表示する Custom Element を作る ▼XSLT 変換で SVG 画像を生成する: XML で表現するウェブページのスクリーンショットの提案 ▼PNG画像のバイナリを読んで解像度情報を特定する ▼Chromium のコードを読んで、画像の NaturalSize の導出過程を追う

キーワード: SVG、PNG、ウェブサイトのスクリーンショット、XML、XSLT、Custom Elements