2025-01-01から1年間の記事一覧
なかなか年末で新しいネタに取り組む元気がないのも20%くらい、残りはちゃんと1年を振り返ってみて、今後やりたいことを整理して2026年に臨もうという考え。 はじめに このブログ自体を本格的にスタートさせ始めたのは2024年の10月末。プライベートの転職を…
前回、ローカルのOCRやLM Studio経由で文字認識を試してみた。今回は追加としてテストしたYomiTokuを紹介する。 はじめに YomiTokuはMLism株式会社が開発しているOCRになる。先日の文字認識の比較対象として、Tesseractとは別のOCRを探していて見つけた。見…
手書き文字起こし、わかりやすく言えばOCRなのだが、の比較をしてみることにした。今回は自分の環境で動作するVLM (Vision Language Model の意図)とクラウドLLMサービス、OSSのOCRとしてはTesseractを比較した。 (追記 2025/12/8) OCRとしてYomiTokuを追加…
以前、OllamaやLM Studioで翻訳をしてみたが、その続き。どちらかというと、、、LM Studioのコンテキスト長調整はありがたいことと、langchain-text-splitterがすばらしいという話になりそうだが笑 はじめに 以前(これやこれやこれ)の復習として、たとえば英…
今まで因子分析について扱ってきた。次として、だいぶジャンプかもしれないが構造方程式モデリングを触ってみようと思う。今回はとりあえず動きそうな例を考えてみて、そのデータに対してPythonの semopy で構造方程式モデリングを動かすところまでを試して…
前回のOllamaでPythonを動かしたものの続き。今回はOllamaと似たサービスというかアプリケーションになるLM Studio。 LM Studioについて いろいろ追っていくと2025年の7月1日に利用規約が変更された(リンクとしては、直近の最新になってしまうと思う)。 Subj…
以前、PDFのテキスト化、Mackdown化について扱った。せっかくなので、これをもとに本文の翻訳も目指していきたい。 単純なのは何かしらの翻訳ツールを利用し、パラグラフごとに翻訳する、などができると、自分としては読みやすくなってありがたい。(たとえば…
以前の因子分析関連では、主成分分析との関係を扱ったが、今回は回転へ行きたいと思う。 とはいえ、回転について、自分ならではで語ることあるか…というと、いろいろな他の方の解説で参考になるものも多く、自分ならではみたいな説明は難しいな、と正直感じ…
少し脇道にそれる内容になるが…最近のPDF→テキスト化のトレンドを確認してみようと思ってきた。というのが、自分は英語がめちゃくちゃ苦手だ笑 それでも、学生時代よりは割り切って翻訳AIを使えることもあり、まあまあ読みやすくはなってきている。 以前も文…
前々回、主成分分析と因子分析の違いについて、自分の主観を書いていくうえでPythonの matplotlib を使っていろいろ図を書いてきた。というか、単純な点数そのままの散布図と、標準化後の数値での散布図。 今回はRの勉強として、 tidyverse の ggplot を利用…
今回ははてなブログの数式の表現を綺麗に出来ないか画策し、MathJaxのバージョンを確認してみた、と言う話。先日、初めてはてなブログで数式を入れた記事を書いた。結構頑張って書いたものの笑 数式の見た目が変になり悲しくなった。 どうやら原因はMathJax…
前回の残りのポイントとして、回転をあげた。因子分析の基本、因子分析らしさが回転だと思う。 回転を考える上で個人的に大事と思っているのが、主成分分析と因子分析の違いだ。完全に個人の思想なので、一般的な違い、正しい違いについては、検索なりAIなり…
先日の性格分析をDeep Researchで調べた記事もそうだが、最近きちんと多変量解析を勉強しなおしてみようかと思っている。完全趣味なので途中でやめるかもしれないが(笑) その分、丁寧めに勉強しなおしてみようかと思っている。 多変量解析としてもいろいろあ…
いろいろ調べるときにGoogle検索だけで無く、PerplexityなどAI検索を利用する機会も増えてきた。さらにしっかり調べようかなと思う時は、GeminiのDeep Researchを利用する機会も多い。 自分は現状、各種LLMサービスに課金はしていないのだが、最近はDeep Res…
思い立って、というかまあ趣味だし勉強し直してみるか、というところで、R言語を再勉強しようと思ってきた。以前触ったのが、数年スパンで前なので、正直あまり覚えていない。 Pythonでいいじゃん、という気もすごくしておりこれまで避けてきたものの、趣味…
Obsidian関係の続き。先日アップグレードしたZoteroとせっかくなので連携してみようと思う。今回は、 Zotero Integrationというプラグインと、結局利用することになった Templater というプラグインを紹介することになる。まあ、それぞれそこまで深い内容に…
最近、話題として目にすることの多いObsidianを使ってみたい。ということで、インストールをしてみた、までが今回の記事になる。 Obsidianについて 公式ページはこちら。Wikipediaによると Obsidian(オブシディアン)とはMarkdown形式による個人ナレッジベ…
今回はZoteroと言う文献管理ソフトを紹介する。最近(でもないかも)アップデートがあったらしく、それを試してみると言う内容になる。 はじめに 文献管理ソフトや、Zoteroについて簡単に紹介しておこうと思う。 文献管理ソフトは、まあその名の通り、文献を管…
ひさしぶりのDocker記事。前回はデスクトップをhomebrewで入れた。せっかくだしコンテナをつかおう、と一緒にコマンドを覚えよう、ということで、OllamaをDockerでインストールしてみる。 実行環境 macOS: Sequoia 15.4 docker desktop: 4.41.2 Ollamaのイメ…
今回は結論のない記事。思うこと系になるかもしれないが、ブログなので良いかなと思っている。 内容は箇条書きについて。特にパワーポイントなど、16:9の画面上での箇条書きについて考える。 箇条書きが美しく見えない パワーポイントなどで3項目程度の箇条…
先日、Clineについての記事を書いた。その際はPythonやJavaScriptを書いてもらったが、文書がメインでも役に立ちそうと感じた。他にも目を向けてみると、最近ではGithub Copilot、Cursor、Windsurf、Devinなど選択肢も増えているようだ。機能は制限されてい…
最近、YouTubeやGoogleのおすすめ記事にも、ClineやCursorといったAIエージェント・エディタの記事が多く出されている。知り合いの記事でも紹介していて、アルゴリズムなどは考えられても、具体的なコーディングが苦手な自分にとってはとても助かるツールな…
2/24(米国時間で、日本では2/25らしい)に公開されてから、Claude 3.7に関する記事を目にする機会が多かった。特に、図やスライド作成までできるという話も多く目に留まった。 図形の作成AIというと、Napkin AIは聞いたことがありどこかで試そうかなと思って…
先日の記事の続き。先日利用したKohya’s GUIは、内部でkohya-ssのsd-scriptsを動作させるツールで、LoRA学習の本体はsd-scriptsになる。sd-scripts自体はpythonのスクリプトツールであり、GUIで動作するタイプではない。逆にいうとGoogle Colabの無料版で動…
先日の記事でStable DiffuisionのWeb UIを動かしてみたが、いろいろ触ってみると画風だったりキャラクターを固定したくなってくると思う。その際に欲しくなってくるのが、自作LoRAだ。LoRAは”Low-Rank Adaptation”の略で、必ずしも画像生成の話だけではない…
次のGoogle Colabでの動作検証として、フレーム補間技術のFILM (FILM: Frame Interpolation for Large Motion)を試してみた。もう少し、丁寧にいろいろと検証して、その内容を書こうかと思ったのだが、そもそも動かすのに多少苦労したので、2025年1月現在、G…
まずは明けましておめでとうございます。定期読者などいない様なブログと思うので、特に2024年のまとめも、2025年の抱負もなしに進めようと思う。 仕事も関係しているが、最近のAI系の事情を勉強しようかと思っており、その中でもとっつきやすそうなものの奥…