フリーペーパー
ソフトウェアエンジニアとして生成AI(LLM)に慣れるための試行錯誤の記録と、身近な情報検索サービスでの応用例の観察記録です。
新しい技術を使いこなすには手を動かして小さな学びを積み上げていくしかない。この一心で、昨年冬のChatGPTの登場から現在に至るまでの約一年の間、大規模言語モデルに慣れるために観察とAPI活用の実践を重ねてきました。せっかくなのでこれらの取り組みを書き残しておこうというモチベーションで執筆が始まった一冊です。本書では、機械学習を専門としないソフトウェアエンジニアの立場として、先行サービスの観察による手掛かりの発見、未知の技術に対する勘を養うための実験、自身が開発するプロダクトへのLLMの効果的な適用方法、高度な技術のより良く見せるUIについて考えてきたことを共有するのを目指します。
知的生産を支援する検索システムを作っている話です。最近ブームな大規模言語モデルのAPIを活用した機能も解説します。マルチモーダルな画像検索とチャットの融合を考えます。
Phonno = Photos + Annotations は興味関心事を発見する画像検索システムです。ウェブアプリケーションとして開発・運用されています。現時点では筆者だけが使える完全プライベートなツールですが、一年以上のドッグフーディングを経てコンセプトも磨きがかかり、だいぶ仕上がってきました。一般公開の機運も高まってきているので、これに先駆けてこだわりの機能の紹介と設計を解説します。自分だけの検索エンジンを作ろうと考えている読者の皆さんの参考になることを願っています。
写真を味わいのあるモノクロ点描画に変換するプログラムができました。
本書では、画像を点描画ふうに変換するツール開発の製作過程をまとめました。前半部は、OpenCVを用いて画像処理を行う話がメインです。Colaboratory上で軽く実験を行って必要な設計を洗い出し、Pythonでコードを書いていきます。よく知られた画像処理手法を組み合わせて、手描き感を醸し出す点描画を生成するCLIツールを作ります。後半では、筆者もこのたび初めて触ったGoogle Cloud Run環境でウェブアプリとして動かすところまで持っていきます。
個人開発記として気楽に読んでいただければ幸いです。
本書は、Web ブラウザにおける本格的な GUI の入門書です。
Web ブラウザに期待される役割は年々増してきています。ネイティブアプリ顔負けのデザインツールや、ドラッグアンドドロップでの操作が必要なフォームを作りたくなったとして、我々は何に気をつけるべきなのでしょうか?これまで HTML / CSS / JavaScript で実装するのが大変だった UI をどう実装するべきなのでしょうか?この点を本書は重点的に扱います。本書では定番のセレクトボックスやヘッダーレイアウトの他、バウンディングボックスやツリーといったドラッグを伴う UI なども実装していきます。苦しくも楽しい、Webブラウザの複雑なGUIの世界に、エディタとブラウザを開きながら足を踏み入れてみましょう。
本書は、SVG(Scalable Vector Graphics)とスクリーンショットについてまとめたものです。
SVGの少し変わった使い方やウェブブラウザでのスクリーンショットの撮影と活用に興味がある、ウェブページをまるごと保存したい、高解像度ディスプレイで撮られたPNG形式のスクリーンショット画像の実寸サイズの取得方法を知りたい方を対象としています。
リンクや GIF 動画も含められる、SVG を用いたスクリーンショットのアイデアの紹介します。
▼SVG Screenshot の開発記: 日々のドッグフーディングで改良を重ねる、趣味開発のモチベーションをお届け! ▼DPI を考慮して画像を表示する Custom Element を作る ▼XSLT 変換で SVG 画像を生成する: XML で表現するウェブページのスクリーンショットの提案 ▼PNG画像のバイナリを読んで解像度情報を特定する ▼Chromium のコードを読んで、画像の NaturalSize の導出過程を追う
キーワード: SVG、PNG、ウェブサイトのスクリーンショット、XML、XSLT、Custom Elements