だいず出版

LLM時代の検索を考える観察日記 Ⅱ

技術書典 18

B5判, 56ページ

大規模言語モデル（LLM）が私たちの情報探索のあり方を根底から揺るがし始めた時代。ソフトウェアエンジニアである著者が、その変化の渦中でLLMといかに向き合い、理解を深めてきたかの記録を綴った「観察日記」の第二弾です。

本書では、前作の2023年末から2025年初頭にかけて、ChatGPT、Gemini、Perplexity、NotebookLMといった主要なLLMサービスが遂げた進化の過程を、具体的な利用体験やAPI活用の試みと共に丹念に追いかけます。先行サービスの観察から得られる手掛かり、自ら行った実験、そして開発者としての視点から見たUI/UXへの考察など、LLMを実用的なツールとして捉えようとする思考プロセスを共有します。急速に変化するLLM時代の検索の「今」を、スナップショットとしてお届けする一冊です。

詳しく見る

LLM時代のメールマガジンとPersonalized AI Agentの探究（フリーペーパー）

ウェブ

技書博 11

B5判, 4ページ

フリーペーパー

読む

創造的な年代記エディタの開発と活用法（フリーペーパー）

ウェブ

技書博 10

B5判, 1ページ

フリーペーパー

読む

LLM時代の検索を考える観察日記

技書博 9

技書博 10

B5判, 60ページ

ソフトウェアエンジニアとして生成AI（LLM）に慣れるための試行錯誤の記録と、身近な情報検索サービスでの応用例の観察記録です。

新しい技術を使いこなすには手を動かして小さな学びを積み上げていくしかない。この一心で、昨年冬のChatGPTの登場から現在に至るまでの約一年の間、大規模言語モデルに慣れるために観察とAPI活用の実践を重ねてきました。せっかくなのでこれらの取り組みを書き残しておこうというモチベーションで執筆が始まった一冊です。本書では、機械学習を専門としないソフトウェアエンジニアの立場として、先行サービスの観察による手掛かりの発見、未知の技術に対する勘を養うための実験、自身が開発するプロダクトへのLLMの効果的な適用方法、高度な技術のより良く見せるUIについて考えてきたことを共有するのを目指します。

詳しく見る

知的生産のための画像検索システム開発記

技書博 9

技書博 10

B5判, 36ページ

知的生産を支援する検索システムを作っている話です。最近ブームな大規模言語モデルのAPIを活用した機能も解説します。マルチモーダルな画像検索とチャットの融合を考えます。

Phonno = Photos + Annotations は興味関心事を発見する画像検索システムです。ウェブアプリケーションとして開発・運用されています。現時点では筆者だけが使える完全プライベートなツールですが、一年以上のドッグフーディングを経てコンセプトも磨きがかかり、だいぶ仕上がってきました。一般公開の機運も高まってきているので、これに先駆けてこだわりの機能の紹介と設計を解説します。自分だけの検索エンジンを作ろうと考えている読者の皆さんの参考になることを願っています。

詳しく見る

Pixel Fold 活用日記（フリーペーパー）

ウェブ

技書博 9

B5判, 2ページ

フリーペーパー

読む

写真を点描画ふうに変換するツールをつくる

ウェブ

技術書典 10

技書博 7

技書博 9

B5判, 64ページ

写真を味わいのあるモノクロ点描画に変換するプログラムができました。

本書では、画像を点描画ふうに変換するツール開発の製作過程をまとめました。前半部は、OpenCVを用いて画像処理を行う話がメインです。Colaboratory上で軽く実験を行って必要な設計を洗い出し、Pythonでコードを書いていきます。よく知られた画像処理手法を組み合わせて、手描き感を醸し出す点描画を生成するCLIツールを作ります。後半では、筆者もこのたび初めて触ったGoogle Cloud Run環境でウェブアプリとして動かすところまで持っていきます。

個人開発記として気楽に読んでいただければ幸いです。

詳しく見る

点描画に変換するツールの全体像（フリーペーパー）

ウェブ

技書博 7

技書博 9

B5判, 2ページ

フリーペーパー

読む

入門GUI（商業誌・共著）

ウェブ

B5判, 92ページ

本書は、Web ブラウザにおける本格的な GUI の入門書です。

Web ブラウザに期待される役割は年々増してきています。ネイティブアプリ顔負けのデザインツールや、ドラッグアンドドロップでの操作が必要なフォームを作りたくなったとして、我々は何に気をつけるべきなのでしょうか？これまで HTML / CSS / JavaScript で実装するのが大変だった UI をどう実装するべきなのでしょうか？この点を本書は重点的に扱います。本書では定番のセレクトボックスやヘッダーレイアウトの他、バウンディングボックスやツリーといったドラッグを伴う UI なども実装していきます。苦しくも楽しい、Webブラウザの複雑なGUIの世界に、エディタとブラウザを開きながら足を踏み入れてみましょう。

探究 SVGとスクリーンショット（商業誌）

ウェブ

B5判, 82ページ

本書は、SVG（Scalable Vector Graphics）とスクリーンショットについてまとめたものです。

SVGの少し変わった使い方やウェブブラウザでのスクリーンショットの撮影と活用に興味がある、ウェブページをまるごと保存したい、高解像度ディスプレイで撮られたPNG形式のスクリーンショット画像の実寸サイズの取得方法を知りたい方を対象としています。

探究 SVGとスクリーンショット

ウェブ

技書博 2

B5判, 72ページ

リンクや GIF 動画も含められる、SVG を用いたスクリーンショットのアイデアの紹介します。

▼SVG Screenshot の開発記: 日々のドッグフーディングで改良を重ねる、趣味開発のモチベーションをお届け！ ▼DPI を考慮して画像を表示する Custom Element を作る ▼XSLT 変換で SVG 画像を生成する: XML で表現するウェブページのスクリーンショットの提案 ▼PNG画像のバイナリを読んで解像度情報を特定する ▼Chromium のコードを読んで、画像の NaturalSize の導出過程を追う

キーワード: SVG、PNG、ウェブサイトのスクリーンショット、XML、XSLT、Custom Elements