48コアで300ドルの謎のZen2 CPU, EPYC 7K62を買ってみた

まえがき 2020年のK40m購入から始まり、GPUをP40にしたりサーバー用マザボを導入したりMI50を試してみたりと徐々に進化を続けてきたホームラボ環境。 hashicco.hatenablog.com またふとebayを見ていると、なんと300ドルで48コア、しかもZen2のCPUが売られて…

2024-07-06

Transformers高速化ライブラリvLLMのAsyncLLMEngineを利用した非同期高速文章生成

概要先日までKaggleのAIMOコンペ(数学の問題をLLMに解かせて正答率を競う)に参戦していました。結果は初のチーム参加でメンバーに助けられつつ運もあり、なんとか銀メダルを取れました！これでMasterにリーチがかかりましたが、金メダルは未だ取れる気がし…

2024-04-09

句読点のない日本語の文章に句読点を挿入するBERTモデルを作る

概要 Whisperなどで日本語の文字起こしをした後の文章にほとんど句読点が入っておらず、そのまま文字起こし文章を結合すると利用しにくいことがありました。そこで何らかの手法で句読点を挿入したいと思ったのですが意外と手軽な古典的な手法が見つかりませ…

#機械学習 #自然言語処理

2024-04-04

【ベンチマーク編】 Radeon Instinct MI50を買って機械学習用に使ってみる【ROCm】

まえがき ROCmを試すためにRadeon Instinct MI50を買ってみて、PyTorchで使えるようにセットアップをしたのが前回。 hashicco.hatenablog.com 今回は取ったベンチマークの結果をご紹介！まとめ ROCmは本当にほぼコード変更無しでCUDA用のTensorFlow、PyTorc…

#Rocm #AMD #GPU #instinct

2024-04-01

【セットアップ編】Radeon Instinct MI50を買って機械学習用に使ってみる【ROCm】

まえがきしばらく大きな買い物をしていなかったが、仕事からの現実逃避をしているとふと思う。「ROCm、試してみたいなー」ということで、ebayを開きめぼしいGPUを探してみたところ、$200以下のお手頃価格で一応ギリギリ最新のROCm 6.0.2にもメンテナンスサ…

#AMD #GPUコンピューティング #機械学習 #Rocm

2024-02-27

PyTorch/TensorFlowのトレーニング時にWSL2がハングする現象

結論今回は結論のみ。 WSL2上でPyTorch/TensorFlowで画像モデルのトレーニングを行う際に、データローダーをマルチスレッドで動かすと、トレーニングがハングする現象が発生しました。ある程度のイテレーションは学習が進むのですが、途中で突然プログレス…

2024-02-02

【PyTorch小ネタ】複数モデルを組み合わせたモデルにおいて別々のPretrained Weightを読み込む方法

まえがき時の流れは早いもので、もう2024年になってしまったようです。最近はKaggleやら実践的な個人活動は一先ずお休みし、社会人5年目になる前に一旦基礎固めし直そうと線形代数/解析学/統計の勉強をしたり新しく出たBishop本を読んだりしており、あまり…

2023-10-18

Transformers Trainerを使ってみて分かりにくかった仕様など

まえがき言語モデルを自分でガッツリ使う経験が今まで無かったので、勉強がてら先週火曜日まで開催されていたKaggle - LLM Science Exam というコンペに参加してました。 www.kaggle.com そこそこ頑張った結果、過去最高の成績(49th/2663, Top2%)を取ること…

#Kaggle #huggingface #finetune

2023-09-11

Ryzen9 7950X3D用にAssassin IVを買ってみた

まえがき Ryzen9 7950X3Dを買ったのがちょうど半年前になるのだが、CPUクーラーは5600X用に購入したScytheの忍者5を流用して使っていた。忍者5は非常に静かで安い割にそこそこ冷えるのでお気に入りであったのだが、流石に7950X3Dを冷やすには不十分でCinebe…

#自作PC #Chat GPT Plus #Deepcool

2023-08-12

【続・続】鯖落ちGPUを使った安価な機械学習用マシンの作り方～憧れのEPYCを購入して機械学習用マシンを完全体にする編～

前記事: hashicco.hatenablog.com 後記事: hashicco.hatenablog.com 前書き前記事において、P40を買い増して機械学習用マシンをマルチGPUにした。しかし、普通のRyzenで構成していたがために、PCIeの帯域が足りず片方のGPUがx4接続になってしまっていたの…

#EPYC #自作PC #機械学習

2023-08-06

【続】鯖落ちGPUを使った安価な機械学習用マシンの作り方～夢のマルチGPU環境にしてみる編～

!!注意!!：この記事で取ったベンチマークは、片方のGPUのみECC有効となっていたことが判明しました。PCIeのレーン数も双方のGPUで異なっており、非常にアンバランスな条件で測定した結果となっておりますので、マルチGPUの効果を見るのにはあまり適しており…

#自作PC #機械学習 #NVIDIA GPU

2023-08-05

最近SSDが安いのでオールフラッシュNASを導入した(ASUSTOR FS6712X)

前書き我が家には10GbE搭載のQNAP TS-332XというNASを導入済みである。8TBのHDD2枚でRAID1を組んでおり、10Gの速度を活かすためにリード/ライトのSSDがキャッシュを設定している。 https://www.qnap.com/ja-jp/product/ts-332x hashicco.hatenablog.com 単…

2023-07-20

【IMC2023】KaggleでなんやかんやあってExpertになれた話

概要最近久しぶりにKaggleに復帰して、Image Matching Challenge 2023というコンペに参加しました。結果、92位/464グループという成績でギリギリ銅メダルを獲得でき、晴れてKaggle Competitions Expert(コンペで銅メダル以上2個獲得)となることができまし…

#Kaggle #機械学習

2023-03-28

【2023年最新版】鯖落ちGPUを使った安価な機械学習用マシンの作り方

続編書きました: hashicco.hatenablog.com 背景このブログを始めた2020年頃に、NVIDIA Tesla K40mを使った安価な機械学習用GPUマシンを紹介した。 hashicco.hatenablog.com その後このマシンは勉強用に色々と活用していたのだが、2020年時点でもアーキテク…

#GPU #機械学習

2023-03-17

Xit WirelessはサウンドチップALC4080から音を出せないっぽい

この間PCを新調したばかりなのだが、ちょっとしたトラブル。以前も別記事でXit Wirelessをチューナとして使っていることを書いたが、またXit Wirelessでのコンテンツ視聴ができなくなった。 hashicco.hatenablog.com 今回は依存DLLの不足ではなく、起動まで…

2023-03-12

7950X3Dを買ったのでCCD毎のベンチとか取ってみた

端書ブログでもちょこちょこ書いているように、GPU(RX6900XT→RTX4090)、CPU(5600X→5800X3D)などメインマシンのパーツを割りと頻繁に変えながら使ってきたのだが、マザボやCドライブの変更を伴わなかったので1年半近くOSをクリーンインストールしていなかっ…

#AMD #自作PC #zen4

2023-03-07

WindowsのPyTorch + JupyterにおいてDataLoaderの`num_workers`の数を指定するとハングする(ように見える)

概要ほぼタイトル通り。PyTorchのDataLoaderではnum_workersを指定したときの並列化のために、裏側でmultiprocessingを使っていることが原因のようです。 Windowsにおいてmultiprocessingはif __name__=="__main__"ブロックの中で実行されることが想定され…

#Pytorch #Python #機械学習

2022-12-28

TensorFlow2.11からはWindows用のGPU対応ビルドがpipで配布されないらしい

内容最近少しkaggleをお休みしTypeScriptを勉強していたり、仕事でもほとんどPyTorchしか使っていなかったりでTensorFlowの動向を追っていなかったのだが、ちょっとした衝撃的なニュースを今日知った。なんとタイトルの通り、TensorFlowの最新版2.11.0(2022…

#機械学習 #TensorFlow

2022-12-03

また出た！新たなる無線MMOマウスの選択肢 Razer Naga V2 Hyperspeedを買った

概要今までG600→Naga Pro→Aerox9と無線化を求めて横12ボタンマウスを試して来たのだが、Naga Proはサイドボタンの不安定さ、Aerox9はサイドボタンの配置の合わなさから、結局G600から乗り換えることができずにいた。そんな折、Razerから新たな無線MMOマウ…

2022-10-17

RTX4090の機械学習性能を確かめるため`ai-benchmark`をやってみた

概要タイトル通り、先日購入したRTX4090の機械学習性能を測定するために、ai-benchmarkなるものを取ってみた。測定したマシンや買ったRTX4090の詳細等は過去記事参照のこと。 hashicco.hatenablog.com まとめスコアは次の通り。 Device Inference Score: …

#RTX4090 #機械学習 #GPUアクセラレーション

2022-10-16

ZotacのRTX4090を買ったのでゲーム性能と機械学習性能を確かめてみた

概要 2年ぶりに訪れたコンシューマ向け新世代GPUの発売シーズン。その第一弾であるNVIDIAのRTX4090が先日2022/10/12に解禁された。前回のRTX30xx、RX6000シリーズの発売時には、初日の争奪戦で破れちょっとした後にRTX3080を買い、その後VRAM容量を求めてRX…

#tensorflow2 #RTX4090 #FF XIV #GPU #3DMark

2022-09-08

横12ボタン無線マウスの新作 SteelSeriesのAerox9を買ったのでNaga Pro, G600と比較する【FF14】

概要少し前、SteelSeriesから横12ボタンのMMO用無線マウスが新発売された。前から出ているのは気づいていたのだが、値段が高いしG600もRazer Naga Proも持っているので買わなかった。 akiba-pc.watch.impress.co.jp 今回アマゾンのタイムセール祭りで税込み…

2022-09-03

【田舎の回線事情】ピカラの10Gbpsプランはちゃんと実測でマルチギガな速度が出る

概要私の居住地は現在徳島である。住んでいる集合住宅の都合上、光回線のプロバイダーはSTNet ピカラという、ここに来るまで聞いたこともなかった元四国電力系のプロバイダーを利用している。元々1Gbpsの契約をしていて速度的に不満はなかったのだが、なん…

#Pikara光（ピカラ光） #徳島

2022-06-23

AMD/Intel GPUでもTensorFlowを高速化できるTensorFlow-DirectMLがTF2対応したらしい(まだプレビュー)

概要以前こちらの記事で書いたように、DirectXを介して機械学習系の演算を行うことで、CUDAが使えるnvidiaのGPUに限らず、DirectX12に対応するあらゆるGPUにおいて機械学習を高速化できるというmicrosoftのDirectMLというプロジェクトがある。(ただし、Dire…

#GPUアクセラレーション #機械学習 #tensorflow2

2022-04-10

KaggleでGoogle ColabやTPUを使うためのTips集

概要意外とKaggleでColabやTPUを使う情報が少ないので、Kaggle NotebookをTPU対応させたりそれをColab対応させたりするときのTipsをご紹介します。基本はTensorflowに関する記述です。 strategyを定義してmodel.fitのときにstrategy.scope()のブロックで実…

#機械学習 #TPU #google colab

2022-04-10

Google Colab Proで使えるGPU, TPUの現状(20220410)

まとめ (2022/10/21追記) Google Colab ProのGPU割当の仕様は大きく変わりました。従って下の記述はほぼ無意味です。未だにV100とA100が自由に選択できないガチャ要素はあるようですが、基本的にはトークン制で使いたいGPUを選べるようになったそう。次の記…

2022-02-13

HPのウルトラワイドモニター X34を買った

概要 FF14プレイヤーなら一度は耳にするであろう、「ウルトラワイドモニターは視界が広くてプレイしやすい」との噂。今まで23インチ FHD(EIZOのFlexscan), 27インチWQHD(NECのLCD-PA271W), 31インチ4K(Acer ET322QK C)と着実にモニタをサイズ＆解像度アップ…