@KIDs66951395 @umajirou_3 できるかもしれません。
posted at 09:51:17
Stats | Twitter歴 4,787日(2010/10/30より) |
ツイート数 88,389(18.4件/日) |
表示するツイート :
@KIDs66951395 @umajirou_3 できるかもしれません。
posted at 09:51:17
@KIDs66951395 考慮していないですが、可能かと思います
posted at 15:42:14
Pyvis: Visualize Interactive Network Graphs in Python https://towardsdatascience.com/pyvis-visualize-interactive-network-graphs-in-python-77e059791f01… いい感じにネットワークを描けた
posted at 16:44:53
データサイエンスやデータ分析よりも、データマイニングが自分の得意分野的に一番しっくりくる
posted at 18:18:17
「起業家になりたい」って人は書籍で勉強するのオススメ。思っている以上にみんな読んでないので、ただ読むだけで頭一つ抜けます。かんたんでよいです。
読んで絶対損しないよってものをいくつかぶら下げときますので、ご参考までに。(他の起業家の方もオススメあれば教えてあげてくださいー!)
Retweeted by gepuro
retweeted at 00:36:50
知らない本が多いな。
posted at 00:37:07
@yokkuns ローカルで動くなら使いたいですが、クラウド依存なので今のところは興味ないです
posted at 00:38:02
@yokkuns エクセルで処理出来るデータに他のソフトを経由せずに機械学習やスクレイピングが出来るので。エクセルの規模感のデータをクラウドに転送してまで処理するために、従量課金(になる?)は不便そうですね。
posted at 00:43:12
BigQuery上で生成AIがSQLの記述、補完、クエリの説明までしてくれるDuet AI in BigQueryがプレビューに🎉日本語で動きます👍 BigQueryコンソールでコメントすると、テーブルメタデータを利用して実際にあるテーブルとカラムなどからSQLを生成、SQLの意味も説明してくれます。
https://cloud.google.com/bigquery/docs/write-sql-duet-ai… https://twitter.com/i/web/status/1696639868955435094…
Retweeted by gepuro
retweeted at 09:43:37
@sas20yen 書きますか
posted at 09:38:36
ニュースを読むのはAIがやる時代か
posted at 18:43:22
やっぱファインチューンとかRAGとかごにょごにょするより、単純にembでベクトル検索して結果を表示するだけで良くね?って思った。 https://note.com/npaka/n/nec63c01f7ee8…
Retweeted by gepuro
retweeted at 20:52:42
@sas20yen おっ、面白そうですね
posted at 09:00:10
@KIDs66951395 どこかに載せますね
posted at 09:48:07
「推測されやすい」パスワードを入力させないためにフロントエンドエンジニアができること https://speakerdeck.com/uirikuto/tui-ce-sareyasui-pasuwadoworu-li-sasenaitamenihurontoendoenziniagadekirukoto…
posted at 11:19:49
これ個人的にはめちゃくちゃいいと思ってて、自分も実際にトピックのラベリングをLLMにさせてます。
ホントは単語の出現確率も考慮したラベリングができたらもっと良いのだと思うのですが、そこは中々難しそうで… https://twitter.com/gepuro/status/1695801880809812087…
Retweeted by gepuro
retweeted at 18:03:13
@sas20yen マジですか。論文出たら読むので教えてください!
posted at 19:10:12
【クローリングを簡単に】
trafilaturaってPythonライブラリが便利そう。クローリングする時に、サイドバーやヘッダー等の余計な部分を無視して、本文っぽいところを抜き出してくれるライブラリ。見ての通りの簡単な使い方で、ヤホーニュースも難なくパースしてくれました🤗
https://github.com/adbar/trafilatura… https://pic.twitter.com/qJcV8zlVzK
Retweeted by gepuro
retweeted at 23:58:29
トピックモデルのトピック名をChatGPTに作らせるのは、そこそこ上手くいくな。同じようなトピック名になった時の統廃合もやらせるには文字数制限が壁になる。
posted at 15:51:44
バージョンUp版
『2023年版データ分析の100冊』
https://qiita.com/aokikenichi/items/29165f719d6e5631d7d0…
公開しました。
1. 機械学習PJに沿って 46冊
2. データ種別ごと 21冊
3. 分析手法ごと 21冊
4. 数学・Python 7冊
5. 資格・Kaggle 5冊
計 100冊を紹介しています。 https://twitter.com/A7_data/status/1687032307037732864…
Retweeted by gepuro
retweeted at 17:07:14
全方位に意識を向けてる人が少なそうなので、自分はそこを頑張る所存 https://twitter.com/TJO_datasci/status/1695617175111991305…
posted at 22:38:06
重宝される人になるのか、器用貧乏になるのか、どっちだろうね
posted at 22:39:35
新規事業は失敗確率がどうしても高いので、大事なのはいかにリスクを減らすか。その基礎が網羅されている。
新規事業着工力を高める https://amzn.asia/d/0yvK59F
Retweeted by gepuro
retweeted at 22:39:50
トピックモデルのトピック名をChatGPT(gpt-3.5-turbo)に作らせた結果です。ここから先の統廃合は人力でやってしまいましたが、もうひと工夫で完全自動化できそう。ちなみに、利用したデータは有価証券報告書です。 https://pic.twitter.com/Q0xVHbESSL
posted at 23:14:09
良い線までいってるので、ここを拘るのも楽しそうだけど、自分はこの先に興味あるので、技術的には手を抜いた
posted at 23:16:11
最初に作ったクラスタを多くしすぎたかもなあ。BERTopicの練習も少しずつやっていこう
posted at 23:32:16
@tdualdir それが出来そうなんですよね。主成分分析の主成分名を考えさせるみたいなことも試したいです。
posted at 23:33:55
tdual(ティーデュアル)@MatrixFlow@tdualdir
なるほど。
クラスタリングした時のクラス名とかでも同じ事できそうか?🤔
Retweeted by gepuro
retweeted at 23:35:30
データの解釈させる部分をLLMにやらせるのは便利な感じするんだよなあ。データを読む速度が上がる
posted at 23:36:53
色んなデータで試してもらって実用性高いか知りたい
posted at 23:38:05
Mathematical function using Python https://pic.twitter.com/urtu4NUV39
Retweeted by gepuro
retweeted at 19:15:42
BERTopicを動かすにはGPUが必須か
posted at 19:16:18
筋肉の量を計測したら、脚は標準だけど、腕が平均以下になってて課題あり。
posted at 23:46:55
Solar2D is a Lua based game engine with focus on ease of iterations and usage https://solar2d.com/ Luaで書けるゲームエンジン
posted at 10:31:54
Kaggleで学んだBERTをfine-tuningする際のTips⑥〜LLMでも使える学習効率化編〜 https://www.ai-shift.co.jp/techblog/3609
posted at 10:41:04
@whywaita わいわい
posted at 13:43:43
赤字踏みまくりを見ると不安になるようになってしまった。
posted at 19:25:25
データ処理のパイプラインを作るのにkedroが良いと思ってるのだけど、イマイチ流行ってないんだよな
posted at 18:27:36
@lTlanual 悲しみ。画像を使うのは厳しそうですね
posted at 19:23:24
2023/08/24@渋谷にて、DeNA主催イベント「Delight Biz×Analytics night #1」 開催決定!
第1弾はDeNAデータアナリストの実務をDeNAと第一生命の共同プロジェクト事例から紹介。パネルディスカッションや懇親会もあります。
ぜひ奮ってご応募ください!
Retweeted by gepuro
retweeted at 14:36:05
マッキンゼーが社員向けに独自AIツールを作ってしまった。社内の情報を知見を総動員し、業界調査や分析、計画などあらゆる問いに回答。現在7000名のPoC中だが作業時間の圧倒的削減に貢献してるそう。顧客向けに提供するかは未定とのことだが、いずれ全ての企業は社内のデータと知見を集約した自社AIを… https://twitter.com/i/web/status/1693600645687988477…
Retweeted by gepuro
retweeted at 20:29:11
何もしない昨日を過ごしたら、気力が復活した。
posted at 15:31:05
ゲームの要素を増やすためにパラメータなどの数字を増やしすぎると混乱してしまうなあ。
posted at 12:59:02
汁なしラーメンの大盛り
posted at 13:10:59
手頃なWindows環境としてミニPCを買うか悩んでるけど、ポータブルゲーミングPCを買う方が便利だったりする?
posted at 13:26:17
昆虫食してきた。意外と平気だった
posted at 22:12:38
ミールワームと蝉が気になってたので満足した。
posted at 22:34:22
円安が止まらない
posted at 12:59:17
バイバイ、TweetDeck
posted at 11:45:59
機械学習の勉強Part2: HDBSCAN https://note.com/navy_azalea/n/na859d7ab6ab3…
posted at 17:47:53
講義スライドへの書き起こしデータの対応付け https://www.ieice.org/publications/conference-FIT-DVDs/FIT2007/pdf/E/LE_003.pdf…
posted at 19:47:41