はじめに 総研大日本語言語科学コースの山本悠士です。 記事(というか備忘録)をちょうど書こうとしていたところで総研大 Advent Calendar のお誘いをいただき、 せっかくの機会なので参加させていただくことにしました。 目的 Bures 距離のお気持ちを理解したい。 IBIS2025 にて、2 つの(半)正定値行列の間に Bures 距離 $d$ という尺度があることを知っ...
メモ:Bures 距離の性質
メモ:正準角と特異値分解の関係
目的 $d$ 次元空間 $\mathbb{R}^d$ の部分空間 $\mathcal{P, Q}$ における正準角がなぜ特異値分解で求められるのかを知りたい. (YANS2024 でそういう話を聞いたことがきっかけで書いた記事) [\newcommand{\t}{\mathsf{T}} \newcommand{\bm}[1]{\boldsymbol{#1}}] 定義 $d$ 次元空間 $...
NLP2025 参加記
家に帰るまでが遠足であるように、参加記を書くまでが学会である。 NLP2024 参加記 が好評 (N=1) だったようなので今年も頑張って書く。 今年のひとこと 頑張って予定を立てても全ては崩れる 発表はメモをしながら聞こう Slack を盛り上げるのはプロに任せてお前(山本)は集中しろ 頑張って予定を立てても全ては崩れる ...
EMNLP2024 のタイトル眺めた
これは人間がやる作業ではない。当日は似た論文でセッションが組まれるから、スケジュールを参考に追うのが良いんだけど、他分野との出会いを求めて全部見ちゃう。 できれば自動化したいけど AI/NLP のこと信用できなさそう。(多分信用してたら研究してない) 文埋め込み LongEmbed: Extending Embedding Models for Long Context Retriev...
NL260 参加記
YANS (9/5-7) が終わったことだし NL 研 (6/28-29) の参加記でも書きますか(!?) 参加経緯 NLP2024@神戸 は研究がまとまらなかったので聴講参加だったのだが、同期や後輩がわいわいしているのを見て NLPer を名乗れない気持ちになり、修士課程で学会発表はやっておかねばという焦りが少しあった。スモールスタートしていたことがとりあえず良い感じの結果が得られて、...
研究室の ubuntu サーバーをアップグレードしたときのメモ
unofficial package へのリンクを消す パターン 1 : /etc/apt/sources.list.d 内の全ファイルをコメントアウト パターン 2 : /etc/apt/sources.list.d を移動する unofficial package を消す 以下のコマンドで検出され...
ICML2024 の気になる論文 (WIP)
ICML accepted papers 403 Forbidden openreview.net ...
NLP2024 参加記
全体の感想 埋め込み表現のセッションが減った 去年は C3, C4 (口頭), Q11 (ポスター) の 3 セッションが “埋め込み表現” を冠していたが、今年は A10 (口頭) のみだった。NLP2024 で僕が一番楽しかったセッションは A10 だったので、このようなセッションは残り続けてほしい。永田先生を見習って何本も出さないと? 状態空間モデルの波 状態空間モデルに関する...
fairseq CLI docs (for me)
はじめに OSS を利用しといて「くそ!」とか言うのは、隣の家に勝手に上がり込んで上に出してもらったお菓子がまずいというようなもの。 利用者は八百万の OSS に感謝の気持ちを持って開発するのが大事。 この記事 (メモ) では fairseq のコマンドと引数の対応が正確ではないように感じたので、ソースコードを参照しながら確認していきます。 ...
ICLR2024 の気になる論文一覧
本記事の注意 僕はまだ論文の中身までは目を通してません。 説明は適当です。 記号の意味 「」: 僕の発言 🔴: 主観的興味 🔵: 客観的興味 🟡: 将来、好きになりそう 🟣: 自分の取り組みに関連する ICLR 2024 の論文一覧には載ってないけどまだ採択が決まっていない論文があるっぽ...