本報告では、ユーザー集合Uとアイテム集合Iからなる推薦システムを、圏論と行列代数の統合的枠組みで再構築する。特にarXiv論文[2][7]で提案されたSheaf4Recアーキテクチャと、古典的マトリックス分解手法[3][8]を統合した新しい定式化を提案する。実装戦略としてApache Spark[4]を活用した分散処理を採用し、理論的保証と計算効率の両立を実現する。
g_j = \bigoplus_{i=1}^m \mathcal{F}_i \otimes \mathcal{G}_j
\forall j, \|g_j(S) - δ(g_j(T))\| ≤ L_j \cdot d_H(S,T)
R ≈ UΣV^T \quad (U∈ℝ^{|U|×r}, Σ∈ℝ^{r×r}, V∈ℝ^{m×r})
Apache Spark[4]を活用した分散計算フレームワーク:
from pyspark.mllib.recommendation import ALS model = ALS.trainImplicit( ratings=interactions, rank=100, iterations=10, lambda_=0.01, blocks=200 # 分散処理用ブロック数 )
g_1(u,i) = U_u \cdot V_i^T
g_2(u,i) = \text{SheafConv}(F(u), F(i); \Theta)
g_3(u,i) = \sum_{t∈T_{ui}} e^{-λ(t-t_0)}
h(Y)_i = \bigoplus_{j=1}^n w_{ij} \otimes y_{ij}
\min_W \sum_{u∈U} \|R(u) - h(G(u))\|_F^2 + λ\|W\|_*
val interactions = spark.read.parquet("hdfs://interactions") val model = new ALS() .setRank(100) .setBlocks(200) .run(interactions) val scores = model.userFeatures .join(itemFeatures) .map { case (u, (v_u, v_i)) => (u, dotProduct(v_u, v_i)) }
手法 | 時間計算量 | 空間計算量 |
集中処理[3] | O(m^3) | O(m^2) |
分散処理[4] | O(m^2/p) | O(m√p) |
Sheaf4Rec[7] | O(m log m) | O(m) |
\|R - U^{(k)}Σ^{(k)}V^{(k)T}\|_F^2 ≤ (1 - 1/\text{cond}(R))^k \|R\|_F^2
\|h(Y) - h(Y')\| ≤ \sum_{j=1}^n L_j \|W_j\| \cdot \|y_j - y_j'\|
Core i5 10400F、メモリー16GBで、100文字×100行=1億文字を突っ込んで、あれこれ操作した場合はこのくらいの速度で動く。
benchmark start
Allocated GC Memory:60,392bytes
Allocated GC Memory:416,037,968bytes
Allocated GC Memory:416,082,104bytes
Allocated GC Memory:416,082,272bytes
Allocated GC Memory:416,082,296bytes
Allocated GC Memory:416,082,440bytes
clear buffer
Ropeで、リーフノードをリンクドリストでつないだ場合、挿入と削除、追加、ランダムアクセスはO(Log N)、全列挙はO(N)なのだ。
The rebalancing algorithm is from "Ropes: an Alternative to Strings", by
Boehm, Atkinson, and Plass, in SOFTWARE--PRACTICE AND EXPERIENCE, VOL. 25(12), 1315–1330 (DECEMBER 1995).
The server encountered an internal error or misconfiguration and was unable to complete your request.
Please contact the server administrator at root@localhost to inform them of the time this error occurred, and the actions you performed just before this error.
More information about this error may be available in the server error log.
The server encountered an internal error or misconfiguration and was unable to complete your request.
Please contact the server administrator at root@localhost to inform them of the time this error occurred, and the actions you performed just before this error.
More information about this error may be available in the server error log.
benchmark start
Allocated GC Memory:60,392bytes
Allocated GC Memory:440,048,840bytes
Allocated GC Memory:440,082,632bytes
Allocated GC Memory:440,082,656bytes
clear buffer
Allocated GC Memory:82,280bytes
Rope<T>は削除と置き換え、文字列のランダムアクセスがO(log N)なのでさくさくエディタに比べると遅い。
Hの亜ヒ酸と紙コップの亜ヒ酸とは「同一物,すなわち,同一の工場が同一の原料を用いて同一の時期に製造した亜ヒ酸であると結論づけられた」というSPring-8鑑定書が死刑判決の決定的な証拠となりましたが,この時の測定はバラック装置の実験で,とてもまともなデータが出る状況ではなかったという写真を入手して和歌山地裁へ提出しました.地裁確定判決(p.188)には「SPring-8放射光分析した際の写真も撮っていない。」と書いてありますが,専門誌の論文に’98 12 12という日付入りの写真が掲載されていました.しかもSPring-8では各証拠を1回ずつしか測定していませんでしたが,それが公判で問題になると
という証言がありました.この証言は虚偽です(「嘘」と書きたいところですが,証人の心の中までは知ることができないので「虚偽」と書いておきます).この鑑定人は「和歌山毒カレー事件の法科学鑑定における放射光X 線分析の役割」と題する論文を書いて同一製造業者の「亜ヒ酸が当時の国内には,他に流通していなかった」ので,バラック装置であっても紙コップ付着亜ヒ酸はH亜ヒ酸と「同一物」であることが結論できた,と言い訳しています.この論文が掲載された専門誌は(論文題目で検索すれば誌名はすぐわかります)大学の図書館などで閲覧できます.Hのドラム缶と同じ製造業者の亜ヒ酸は,和歌山市内で多い月には1トン(50kg入りドラム缶で20缶)が販売されていたという公判での証言があります.『和歌山県警察本部,取扱注意,部内資料,和歌山市園部におけるカレー毒物混入事件捜査概要』という冊子にはHのドラム缶は大阪へ同時に輸入された60缶の中の1缶だということがシッピングマークからわかったと書いてあります.このことはある記者が教えてくれました.すぐ冊子で確認しました.この冊子は『取扱注意,部内資料』と言いながら,事件解決の記念として週刊誌・マスコミに広く配布したもので,固有名詞はイニシャルで書かれています.和歌山市内で1か月に販売した1トンの亜ヒ酸の大部分は瓶に小分けして販売していました.
研究室のホームページhttp://www.process.mtl.kyoto-u.ac.jp/ には和歌山地裁へ提出した意見書(1)~(10),(11)~(15)を2つのPDFファイルとして公開しています.
S̄ = ∑ᵢ≠ⱼ |Sᵢⱼ| / (n(n-1))
ここで、S̄ は行列の非対角成分の類似度の大きさの平均を表す。
類似度の分布が偏っている(例:一部の Sᵢⱼ の値が |Sᵢⱼ| ≈ 1 に集中している)場合、エントロピー H は低くなる。一方、|Sᵢⱼ| が全体的に均一で低い場合、エントロピーは高くなる。
エントロピー H と平均類似度 S̄ の関係を概ね次のように近似できる:
H ≈ - log S̄ + C
まず、アルゴリズムの根幹を成す計算複雑性について。O(n)やO(log n)といった表記は表面的な理解に過ぎない。真に重要なのは、問題の本質的な計算困難性だ。P≠NP予想を例に取ろう。この未解決問題は、効率的に解ける問題と解けない問題の境界を定義している。初心者は単にアルゴリズムを暗記するのではなく、この根本的な概念を理解せねばならない。
動的計画法は、単純な最長共通部分列問題やナップサック問題を解くだけでは足りない。bitDPやMonge DPなどの高度なテクニック、さらには凸包トリックを用いた最適化まで習得すべきだ。
older_than:1y larger:300k -is:starred
(category:promotions OR category:social) older_than:30d
label:inbox older_than:180d
label:inbox (category:promotions OR category:social) older_than:2d
Google Apps Script(GAS)を使うとこれを毎日自動で行ってもらえます。
実行する関数:CleanUpGmail デプロイ:Head イベント:時間主導 時間べース:時間ベース 時間の間隔:6時間おき
function cleanUpGmail() { // メインの関数の開始ログ console.log("=== cleanUpGmail start ==="); // 1) 2年以上前 &amp; 300KB以上 &amp; from:gmail.comではない &amp; スター付きではない → 削除 console.log("古い大きなメールは削除"); processThreads("older_than:2y larger:300k -from:gmail.com -is:starred", "trash"); // 2) プロモーション or ソーシャル &amp; 30日以上前 → 削除 console.log("プロモーションとソーシャルは1か月で削除"); processThreads("(category:promotions OR category:social) older_than:30d", "trash"); // 3) 受信トレイ &amp; 180日以上前 → アーカイブ console.log("受信トレイの180日以上前 → アーカイブ"); processThreads("label:inbox older_than:180d", "archive"); // 4) 受信トレイ &amp; プロモーション or ソーシャル &amp; 2日以上前 → 既読 console.log("受信トレイでプロモーション or ソーシャル かつ 2日以上前 → 既読"); processThreads("label:inbox (category:promotions OR category:social) older_than:2d", "markRead"); console.log("=== cleanUpGmail end ==="); } function processThreads(query, action) { // 1回あたり250件だけ処理 var batchSize = 250; // 最初の 250 件のみ取得 var threads = GmailApp.search(query, 0, batchSize); var count = threads.length; Logger.log("検索クエリ: [" + query + "] | 取得スレッド数: " + count); // スレッドごとにアクションを実行 threads.forEach(function(thread) { switch (action) { case "trash": thread.moveToTrash(); break; case "archive": thread.moveToArchive(); break; case "markRead": thread.markRead(); break; default: Logger.log("不明なアクション: " + action); } }); Logger.log("処理したスレッド数: " + count); }
unityじゃないほうのNativeMemoryかB Plush Treeや赤黒木やSortedDictonaryに一定範囲の配列をぶち込んで超えるぐらいしか手がないと思う
もっとも、たいていの場合、挿入や削除でO(log m N)+O(log m N)、探索でO(log m N)程度なのでNativeMemoryを使うよりは早いこともある
ただ、バランシングが発生した場合はN O(log m N)程度かかるけどね…
現代ビジネス | 該当無し | ||
文春オンライン | 該当無し | ||
WEB女性自身 | 該当無し | ||
Smart FLASH | 該当無し | ||
週刊女性PRIME | △ | outbrain.jsは無いがoutbrain.comへのリンクあり | 再現せず |
デイリー新潮 | 該当無し | ||
FRIDAYデジタル | 該当無し | ||
NEWSポストセブン | × | outbrain.js呼び出している | 再現もしました |
PRESIDENT Online | 該当無し | ||
Number Web | 該当なし | ||
東洋経済オンライン | △ | window.datalayer.push内に'boostOutbrain'という項目あり | 再現せず |
AERA dot. | 該当なし | ||
ダイヤモンド・オンライン | 該当なし | ||
日刊SPA! | 該当なし | ||
集英社オンライン | ×(△?) | outbrain.js呼び出している | 再現せず |
ESSE online | △? | log.outbrainimg.comのリンクあり | 再現せず |
CHANTO WEB | 該当なし | ||
女子SPA! | 該当なし | ||
ゲキサカ | ×(△?) | outbrain.js呼び出している | 再現せず |
web Sportiva | ×(△?) | outbrain.js呼び出している | 再現せず |
impress watchにも多数のサイトがあるので一応抜粋して調べてみました
Impress Watch | × | outbrain.js呼び出している |
PC Watch | × | outbrain.js呼び出している |
ケータイ Watch | × | outbrain.js呼び出している |
こどもとIT | × | outbrain.js呼び出している |
窓の杜windows forest | 該当なし |
俺が末代だ(誤用)→ ご先祖様に申し訳ないにゃあ → そもそも先祖って具体的に誰やねん → そうだ、戸籍、取ろう
実際の手続きは市区町村のサイトにやり方書いてあるんで、それを見れば誰でもできます。面倒だったり時間がなかったりする人は司法書士とか行政書士とかに依頼したらやってくれるらしいよ。僕はコミュ障だからそっちの方が面倒なので1人でやった。手続き関連で意味わからんのは定額小為替。読み方もわからんくて、僕は最初郵便局の窓口で「ていがくしょうかわせください」って言って小恥かいた(ていがくこがわせ)。これは要するに戸籍の発行代を、現金は郵送できないから代わりに為替で送るってことなんだけど、小為替の額面にかかわらず1枚の発行に200円の手数料がかかる(2022年までは100円だったらしい)。200円の定額小為替1枚にも200円かかるし、750円の定額小為替5枚で1,000円の手数料だよ⁉ 平日の昼間になんとか時間作ってるのにこんな手数料取られるの、ほんとアホらしい。オンライン決済に対応してくれ。社会人の時間と金を返せー。北方領土も返せー。
まあそんなことは置いといて、戸籍の請求の時に用意しとくと便利なもの挙げときます。①プリンター: これがないと請求書の印刷とか本人確認書類のコピーとかでいちいちコンビニに行かなければいけなくなる。行った。必要項目さえ書いてあれば手書きの書面でもいいらしいんだけど、今時そんな人なかなかいないよね。②角形2号封筒: 請求書発送と返信用として同封する分で結構使う。③A4クリアファイル: 封筒に入れる書類はクリアファイルに入れる、これ社会人の常識ね。え?ギリギリ働けているだけの無能が社会人面してんじゃねえ?いいいいイキってすみません…
戸籍はこれまで法改正によって6種類の様式が作られていて(明治5年式・明治19年式・明治31年式・大正4年式・昭和23年式・平成6年式)、現在入手可能で最古のものは明治19年式。ここまで遡れれば、だいたい江戸後期生まれの先祖がわかります。そして、さらに遡りたくなります、なるんです。ところが、明治5年式はいわゆる壬申戸籍ってやつで、新平民とか元穢多とかの表記があるらしく、昔の差別ガーって五月蠅かった奴らのせいで見ることができない。これ、完全に国民の知る権利の侵害じゃね?今の法律だと直系尊属の戸籍しか請求できないんだし、見せてくれたって何の問題もないよね。まあそもそも、部落差別がどうとかいう話がまず胡散臭すぎるし(職業差別なんか?地域差別なんか?血統差別なんか?)、そんなもん現代に存在しないやろ。解放同盟とか、差別反対って叫んでる連中が日本を歪めてるって、こんなとこでもわかんだね。みんなも部落探訪、もとい曲輪クエスト(©鳥取ループ)してこ♪ 楽しいよ!
戸籍には生年月日や出生地、婚姻などによる入籍・除籍日、死亡日、死亡地などが載っているので、ひとまずExcelでまとめてみた。眺めてみると、子供が早くに亡くなっていたり、夫と死別して出戻りしていたり、養子を迎えたり、韓国京城で死んでたり樺太真岡で死んでたりアメリカで死んでたり、戸籍から見えてくるものなんてその人の人生のごくごくわずかな部分にすぎないけれど、だからこそいろんな人生があったんだなと想像しちゃう。それに対して僕の人生……。もうずっと静止期、Stationary phase。Log phaseが一瞬すぎたんよ。いや、まだ長すぎるLag phaseの途中って可能性もないことも……ないか。
① 引き続き戸籍を請求:多分まだ結構取り寄せられる戸籍が残っているので、続けていこうと思う。古い戸籍は廃棄している自治体もあって(実際にもう無いですって3件ほど言われた・昔は除籍後80年経過したら廃棄してもよかったらしい・今は150年)、あれはとても悲しい。1回広島市に請求した時に無いですって言われたので、もしや原爆のせいか⁉と思って調べてみたんだけど、戸籍は疎開させていて無事で、単純に大正3年以前に除籍された戸籍を廃棄してだけでした。貴重な資料なんだし、廃棄せずに何とか残せんかったんかな。
② 昔の住宅地図を見る:せっかく先祖の本籍地を集めたので、古い住宅地図で本籍地がどういうところだったのかを見てみたい。複写したい。でも住宅地図は図書館でも禁帯出で、地域の図書館とか国会図書館とかの現地に行かないと見ることができないからな……。やるか――住宅地図複写旅――。
③ 菩提寺に過去帳を見せてもらう:これもいつかやってみたいね。
Windows 10 (22H2 19045.4170) 上のEdgeを、数十のタブを開いたまま新バージョン (123.0.2420.53) に更新したらハングアップしたため、タスクマネージャーで強制終了させた
Edgeに導入していた拡張機能には、Session Budy (4.0.2。GoogleのManifest V3に対応するため、最近大規模改修を実施(1。増田の最終節の同番号を参照。以下同)) やuBlock Origin (1.56.0。新規のマイフィルターを多数追加中だった) 等があった
パスワードは別ツールで管理してたため無くてもそんなに困らなかったが、uBlockの設定とSession Budyで雑に保存してた閲覧履歴は必要だったので、Chrome拡張の復旧作業をした
"Default\Local Extension Settings"以下のフォルダと、念のために"Default\IndexedDB""Default\Local Storage\leveldb"の中身を移植(8)して作業完了
Edgeを (アプリファイルを手動で削除したりするのではなく) なるべく安全にアンインストールすれば、正常に再インストールできるのではと考え、検索結果通り(11・12)に作業してみた
コマンドラインでアンインストールを試みた事例(13)が見つかり、実行したらEdgeが削除された (ただし、コマンドプロンプトでもポップアップウィンドウでも実行結果の表示がされなかった)
2. Microsoft Edgeが直ぐ閉じてしまう。 | Microsoft コミュニティ
3. ある日突然「Microsoft Edge」が開かなくなった、さあどうしましょう:山市良のうぃんどうず日記(224) | @IT
5. Windows10の「タスクバーにピン留めしているアプリ」の、「最近使ったもの」と「固定済み(いつも表示)」の設定ファイルとレジストリはここにある #Windows10 | Qiita
6. msconfig(システム構成)で解除してよいのは?使用場面と起動方法 | ドスパラ通販【公式】
7. Windows Hello の概要とセットアップ | Microsoft サポート
8. chrome.storageの実体の場所 #Chrome | Qiita
9. 第2回 グループ・ポリシーとは何か:グループ・ポリシーのしくみ(3/5 ページ) | @IT
10. Microsoft Edge ブラウザー ポリシーに関するドキュメント | Microsoft Learn
11. Windows 11/10からMicrosoft Edgeをアンインストールするシンプルな方法が見つかる | ソフトアンテナ
12. Releases · thebookisclosed/ViVe | GitHub
