研究開発職
2022/5/16
15:49
2025/7/7
9:53
応募要項
機械学習エンジニア
Sansan Labs アーキテクト
データディレクター[Sansan BI]
MLOps・Platformエンジニア
カジュアル面談
Sansan技術本部では中途採用向けにカジュアル面談を実施しています。各プロダクトの開発チームの業務内容ややりがいを現役エンジニアの視点からお話します。「実際に働く人の話を直接聞きたい」「どんな人が働いているのかを事前に知っておきたい」とお考えの方は、ぜひエントリーをご検討ください。
X
登壇イベントや研究情報をお知らせしています
Sansan R&D (@SansanRandD) on X
「Sansan株式会社 技術本部 研究開発部」公式アカウント。画像処理,自然言語処理,経済学など多様なメンバーが活躍しています。イベントや研究情報をお知らせします。#33RandD ▶Blog https://t.co/H5Sno36HkN ▶Slide https://t.co/6Bpz3k9OUU
https://twitter.com/SansanRandD
Speaker Deck
メンバーの登壇資料を掲載しています
Sansan R&D (@sansan_randd) on Speaker Deck
Sansan株式会社 技術本部 研究開発部の登壇資料をまとめています。(2022年2月〜) ・掲載されている内容等は発表時点の情報です。 ・公開に当たり、資料の一部を変更・削除している場合があります。
https://speakerdeck.com/sansan_randd
オフィスについて
研究開発部メンバーの連載記事
第49回「SlackアプリをPythonで作成する際の備忘録」
第48回「Inf1のSageMaker推論エンドポイントをカスタムコンテナで試す」
第47回「StreamlitのアプリをNginxで複数ホスティングする」
記事一覧はこちら
第12回 株式市場とネットワーク分析 (1)
第11回 「NeurIPS'21 読み会」「AAAI'22 読み会」で発表してきました
第10回 PageRank とその周辺を探りたい
記事一覧はこちら
vol.10 Dyadic Cluster-Robust Standard Error を計算する
vol.9 ERGM で学校における Segregation を分析する
vol.8 Double Metropolis-Hastings Sampler によって ERGM のパラメーターの事後分布を推定する
記事一覧はこちら
第26回 Crowd Counting (群衆の数え上げ) を学ぶ
第25回 k-center クラスタリングを学ぶ
第24回 ソフトラベルを学ぶ
記事一覧はこちら
vol.19 趣味は人々をどうつなげるか
vol.18 マルチレベルネットワークについての簡単な解説
vol.17 ネットワークは経済発展の映し鏡か?
記事一覧はこちら
Google Compute Engine + GPUで動作するMLサービスの基盤を刷新した話(技術選定編)
チーム開発合宿 2024 in 徳島県神山町(技術編)
Firehoseを介したS3への中間データ保管と検索性強化
記事一覧はこちら
第五回 サンプルサイズ計算はゲームのガチャが教えてくれる
第四回 統計的検定で実務の施策が効果的か考える
第三回 統計的検定はゲームのガチャが教えてくれる
第二回 認識精度が十分かはガチャが教えてくれる
第一回 実務に必要な統計学はすべてゲームのガチャが教えてくれる
研究開発部の技術
第5回 ニュース配信を支える自然言語処理技術
第4回 coremltoolsを用いたCore MLモデルへの変換
第3回 名刺に特化した文字認識エンジン「NineOCR」
第2回 SansanにおけるエッジAIの活用事例
第1回 Sansanの名刺データ化技術
2023年 研究開発部 新卒技術研修
テストコード編
実践編
歴史をたどってディープラーニングを学ぶ の検索結果 - Sansan Builders Blog
Sansanのものづくりを支えるメンバーの技術やデザイン、プロダクトマネジメントの情報を発信
https://buildersbox.corp-sansan.com/search?q=%E6%AD%B4%E5%8F%B2%E3%82%92%E3%81%9F%E3%81%A9%E3%81%A3%E3%81%A6%E3%83%87%E3%82%A3%E3%83%BC%E3%83%97%E3%83%A9%E3%83%BC%E3%83%8B%E3%83%B3%E3%82%B0%E3%82%92%E5%AD%A6%E3%81%B6
SocSci, Radio の検索結果 - Sansan Builders Blog
研究員の前嶋です。 SocSci Radio powerd by DSOCの第2回を配信しました。 SocSciラジオとは SocSciラジオとは、Sansan DSOCの社会科学系データサイエンティストチームのM研究員が、 社会ネットワークの話題を中心に、社会科学の知識や知見をゆるっと紹介していくポッドキャストプログラムです。 sansan-dsoc.com 第2回となる今回は、「社会ネットワークはデザインできるか?」というテーマについて紹介しています。これまでの社会ネット...
https://buildersbox.corp-sansan.com/search?q=SocSci+Radio
研究開発職に関する記事
データ分析の向こう側に、「人の本当の価値」を見つけたい。Sansanならばそれを叶えられる
技術本部 研究開発部 Architectグループ 坂口 遥 インタビュー
#自動化
コンテナ基盤Orbitの紹介 - Sansan Tech Blog
はじめに こんにちは。Strategic Products Engineering Unit SREグループの辻田です。 先日の青島太平洋マラソンにて3時間58分でサブ4を達成してきました。1年前のアドベントカレンダー記事でサブ4したいと書いてたので、自分の目標を叶えることができてとても嬉しいです。*1 さて、われわれ…
https://buildersbox.corp-sansan.com/entry/2024/12/22/000000
Slackに投稿された通達をNotionDBでToDo化する - Sansan Tech Blog
本記事はSansan Advent Calendar 2024の7日目の記事です。 こんにちは。 技術本部研究開発部の高橋寛治です。 Slackに投稿された読了や対応を求められる通達の対応漏れを防ぐために、自動でNotion上にToDoを追加する仕組みを作りました。 その成り立ちや機能、実装の概要、効果について紹介しま…
https://buildersbox.corp-sansan.com/entry/2024/12/07/000000
BigQueryのストレージ課金モデルの自動最適化 - Sansan Tech Blog
研究開発部の田仲です。 本記事は、Sansan Advent Calendar 2024の3日目の記事です。 背景 どちらの課金モデルが適しているかを判断する 自動的に安い方にする 処理概要 ポイント まとめ
https://buildersbox.corp-sansan.com/entry/2024/12/03/000000
GPTsによる執筆支援Botとtextlintによる校正Botをつくってみた - Sansan Tech Blog
本記事は、Sansan Advent Calendar 2023の1日目の記事です。 こんにちは。 技術本部研究開発部の高橋寛治です。 毎年恒例のアドベントカレンダーの時期がやってきました。 今回は、技術ブログの執筆を技術で支援するツールを用意したため、その内容を紹介したいと思います。 なお、本記事はそのツールを用いて…
https://buildersbox.corp-sansan.com/entry/2023/12/01/110000
#DevOps
KEDAを導入してAWS SQSキューとHTTPリクエストベースのスケーリングを実現する - Sansan Tech Blog
こんにちは、年始に研究開発部ArchitectグループからSPEU(Strategic Products Engineering Unit) SREグループに異動したジャン(a.k.a jc)です。 本記事では、異動前に研究開発部Architectグループが開発・運用している、Circuitと呼ばれるKubernete…
https://buildersbox.corp-sansan.com/entry/2025/01/23/100000
Argo CDとArgo Workflowsにおける認証・認可の設定 - Sansan Tech Blog
こんにちは、研究開発部 Architectグループ ML Platformチームのジャン(a.k.a jc)です。 本記事はSansan Advent Calendar 2024の15日目です。 Argo CDとArgo Workflowsにおける認証・認可の設定について紹介します。
https://buildersbox.corp-sansan.com/entry/2024/12/15/000000
ArgoCD Image Updaterから内製ツールに移行した話 - Sansan Tech Blog
こんにちは、研究開発部 Architectグループ ML Platformチームでインターンをしていた上田です。 今回はCI/CDパイプラインで利用されていたArgoCD Image Updaterを内製ツールに移行した経緯について紹介します。
https://buildersbox.corp-sansan.com/entry/2024/11/14/110000
EKSにおけるNamespaceごとにCloudWatchとEC2のコスト按分方法 - Sansan Tech Blog
研究開発部 Architectグループ ML Platformチームのジャン(a.k.a jc)です。今回はKubernetes(EKS)におけるコスト按分のお話しをします。 背景 2022年に弊社研究開発部でAWS EKS上にCircuitというアプリケーション基盤を導入しました。 speakerdeck.com よ…
https://buildersbox.corp-sansan.com/entry/2024/09/04/110000
プラットフォームチームを離れ、利用者になり感じたこと - Sansan Tech Blog
研究開発部 Architectグループ ML PlatformチームのKAZYこと新井です。 名古屋にある中部支店に所属しています。 先日、一時的にML Platformチームを離れて社内向けシステムを、チームが開発・運用するアプリケーション基盤 "Circuit" に構築しました。 基盤自体の開発ではなく、初めて利用…
https://buildersbox.corp-sansan.com/entry/2023/08/24/110000
blue/green戦略によるKubernetesクラスタ更新時にIstioの対応方法 - Sansan Tech Blog
研究開発部 Architectグループ ML Platformチームのジャン(a.k.a jc)です。 前回弊チームのKAZYがKubernetesクラスタ更新時のマニフェスト差分をGitのブランチで吸収する方法を紹介しました。 buildersbox.corp-sansan.com 今回は解像度をあげてKuberne…
https://buildersbox.corp-sansan.com/entry/2024/07/05/110000
#データ分析
Cloud ComposerとCloud Run Jobsを組み合わせたデータパイプラインの構築 - Sansan Tech Blog
こんにちは。研究開発部 Architectグループの中村です。 本記事は、Sansan Advent Calendar 2024の2日目の記事です。 今回は、Cloud ComposerとCloud Run Jobsを組み合わせたデータパイプラインの実装について紹介します。
https://buildersbox.corp-sansan.com/entry/2024/12/02/000000
本番相当の環境でdbt runを安全に検証する - Sansan Tech Blog
はじめに 開発環境のご紹介 dbt run テスト dbt run によって生成されたデータは一定期間で削除する必要がある 開発の影響があるモデルだけテストしたい GitHub Actions を使いたい まとめ はじめに こんにちは。技術本部研究開発部 Architectグループの田辺です。本記事は Sansan A…
https://buildersbox.corp-sansan.com/entry/2024/12/01/000000
ベイジアン操作変数法でA/Bテストをしよう - Sansan Tech Blog
こんにちは。4月に24新卒として入社しました、技術本部 研究開発部の金髙です。大学院では政治学の研究をしていました。 本記事では、筆者が2024年2月から約1カ月間の内定者インターン時代に取り組んだ内容の一部である「ベイジアン操作変数法を用いたA/Bテスト」について紹介します。
https://buildersbox.corp-sansan.com/entry/2024/06/06/150000
A/Bテストを推進しようとしている話 - Sansan Tech Blog
技術本部 研究開発部の小松です。社内/社外向けのアプリケーション開発や、社内のデータ活用促進、学術研究に取り組んでいます。 本稿では、Sansan社内でデータに基づく意思決定を浸透させるために、A/Bテストの活用を推進しようとしている取り組みについて書きます。「しようとしている」という表現からわかるように、他のテック企…
https://buildersbox.corp-sansan.com/entry/2024/05/30/150000
BigQuery上で土日祝日対応したカレンダーテーブルを作成する - Sansan Tech Blog
こんにちは。 研究開発部Architectグループにてデータエンジニアとしてデータ分析基盤の開発・運用をしている中村です。 今回はBigQuery上で利用可能な祝日対応したカレンダーテーブルを作成する方法についてご紹介いたします。
https://buildersbox.corp-sansan.com/entry/2023/10/24/110000
spaCyを用いて日本語の固有表現抽出(NER)モデルを学習する - Sansan Tech Blog
はじめに 最近、固有表現抽出(Named Entity Recognition: NER)の学習をspaCyを用いて行う機会があったため、そのやり方について簡単にまとめたいと思います。
https://buildersbox.corp-sansan.com/entry/2023/07/26/110000
分析の再現性を担保する工夫 - Sansan Tech Blog
はじめに 技術本部 R&D の小松です。先日、一橋大学の手島健介教授より『経済セミナー』2023年2・3月号をご恵贈いただきました。 www.nippyo.co.jp 手島教授はその中で「米国経済学会データエディター制度の取り組み 再現性向上のためのreplicationチェック」を書かれています。私たちが『経済セミナ…
https://buildersbox.corp-sansan.com/entry/2023/02/27/110000
hypothesis+panderaで始める、データフレームに対するProperty Based Testing - Sansan Tech Blog
技術本部 R&D研究員の前嶋です。 梅雨の季節ですが、少しでも快適に過ごせるようにOnのCloud 5 wpを購入しました。水に強くて軽快な履き心地で最高ですね。(追記:この記事の公開作業をしている間に梅雨が終わってしまいました) 今回は、データフレームのテストについての記事です。 データが中心となるサービスのネックになるのが テストをどう書くか です。というのも、データフレームは行×列の構造になっているため、入力あるいは出力値がデータフレームになるような関数が多いプログラムでは、テストケースを書くのが非常に面倒です。仕様の変更があった場合、それぞれのテスト用の疑似データに修正を加えることを考えると、より簡潔にデータフレームのバリデーションをする方法が欲しいところです。実は、データフレームのテストはProperty Based Testingという考え方と非常に相性が良いです。今回の記事では、 pandera と hypothesis ライブラリを活用した、データフレームに対するProperty Based Testingの方法を紹介します。 Property Based Testing(PBT) は、Haskellの QuickCheck で導入された概念だと言われています。一般的なExample Based Testing、つまり、ある値を入力したときの出力値(と状態)を検証するテストとは異なり、Property Based Testingは、入力値あるいは出力値が特定の属性(property)を満たしているかを検証します。例えば、自然数を整数倍する関数があったときに、その出力値は整数という属性を満たしている必要がありますが、入力値でさまざまなパターンで試してみて、結果が整数にならない場合はその例を返します。 契約による設計(Design by Contract, DbC)を実現するテスト手法として、名著『達人プログラマー』でも推奨されています。 hypothesis は、PythonでPBTを行うためのライブラリです。 hypothesis.readthedocs.io import hypothesis from hypothesis import strategies as st テストケースを生成する戦略(strategy)を定義します。例えば st.integers() はint型から生成を行い、 st.text() は文字列からの生成を行います。 example() メソッドを使うと、戦略に沿って具体的な例を1つ生成します。 >>> st.integers().example() 110 いくつか同時に例を生成してみます。 大小さまざまな値が生成されていることが確認できます。 ここから実際にテストをしていきます。例として、整数型の入力値を2乗する関数を作ってみます。 特定の戦略に沿ってテストケースを生成する、ということを指示するためには、テスト用の関数に @hypothesis.given デコレータを付与します。今回はテストフレームワークにpytestを、ipytest経由で使っています。 %%ipytest @ hypothesis.given(st.integers()) def test_square_int(num): assert type(square_int(num)) == int test_square_int() 実行結果 .
https://buildersbox.corp-sansan.com/entry/2022/08/10/110000
#機械学習
バージョンが多すぎるYOLOについて語りたい - Sansan Tech Blog
本記事はSansan Advent Calendar 2024、18日目の記事です。
https://buildersbox.corp-sansan.com/entry/2024/12/18/000000
【Sansan Tech Talk】研究開発部のプラットフォーム戦略 〜マルチプロダクト環境における課題と展望〜 - Sansan Tech Blog
こんにちは、Sansan Engineering Unit 部長の笹川裕人です。今回で7回目を迎える「Sansan Tech Talk」では、Sansanのテックリードが日々取り組んでいる技術的な課題や挑戦を深掘りしてお届けしています。今回は、研究開発部で活躍するWebアプリエンジニアの新井和弥にインタビューしました。…
https://buildersbox.corp-sansan.com/entry/sansan-tech-talk-randd-arai
最適輸送が好きな6つの理由 - Findy Engineer Lab
Sansan株式会社の大田尾匠さんが、確率分布間の距離を計算する手法「最適輸送」の魅力と応用について解説。自然言語処理などへの応用事例、Pythonで実装したコード例まで紹介します。
https://findy-code.io/engineer-lab/reason-optimal-transport
Automating everything with macOS and Ollama - Sansan Tech Blog
Hi, I'm Juan Martínez, Researcher at Sansan's R&D Department.During the last year our team has been building a growing number of applications that leverage the …
https://buildersbox.corp-sansan.com/entry/2024/05/07/110000
自社OCRエンジン「NineOCR」の学習効率化のため SageMaker Training を導入した話 - Sansan Tech Blog
はじめに NineOCR とは NineOCR が抱える課題 Amazon SageMaker Training とは SageMaker Training の始め方 事前準備 AWS が提供しているコンテナイメージを拡張する方法 独自のコンテナイメージに SageMaker Training Toolkit をインス…
https://buildersbox.corp-sansan.com/entry/2023/03/06/110000
BERTopic で文書のクラスタリングを試す - Sansan Tech Blog
こんにちは。研究開発部の青見 (@nersonu) です。 そろそろ花粉症の季節ですね。週1でしか出社しない私は、なんとか引きこもって数ヶ月しのぎたいところです。 さて、今回は BERTopic という OSS について、さっくりとした手法の解説もしつつ、簡単に文書のクラスタリングを試そうと思います。 github.c…
https://buildersbox.corp-sansan.com/entry/2023/02/21/110000
第26回 MLOps 勉強会で発表しました - Sansan Tech Blog
研究開発部 Architectグループの堤(@shu223)と申します。2022年12月7日に開催された 第26回 MLOps 勉強会 - connpass で登壇の機会をいただき、「SansanにおけるエッジAIの実用例とMLOps」というタイトルで発表させていただきました。
https://buildersbox.corp-sansan.com/entry/2022/12/25/000000
coremltoolsを用いたCore MLモデルへの変換 - Sansan Tech Blog
研究開発部Architectグループの堤です。最近は研究開発部の技術や成果物について紹介する記事を いくつか書いてきた のですが、 今回は、下記記事で紹介した"Smart Captured"(略してスマキャプ)の開発の中で行った「Core ML化」について深堀りしたいと思います。 buildersbox.corp-sansan.com 上に載せた記事内で、スマキャプでは以下の機械学習モデルの推論処理をオンデバイスで行っている、と書きました。 名刺検出(名刺の矩形を検出) 名刺切り出し(セグメンテーション) それぞれのモデルはTensorFlowで学習しています。 さらにiOSでは、モデルをCore MLに変換することで、 大幅なパフォーマンス向上 に成功しています 。 矩形検出は300%高速化(18 fps → 55 fps) セグメンテーションも推論時間は0.01〜0.02[s] さらに、機械学習モデルの推論処理のためのCPU負荷が下がることで、UIの描画やユーザーインタラクションのレスポンスも改善されます。下図は、変換前・後のモデルを切り替えてCPU使用率を可視化したものになります。 本記事ではこの Core ML化の具体的な手順や勘所 について、詳しく解説します。 そもそもなぜCore ML化すると速くなるのか、について解説しておきます。 Core MLは、機械学習モデルをiOS, macOS, watchOS, ...に組み込むためのApple製のフレームワーク, モデルフォーマットなのですが、 iOSで機械学習モデルの推論処理を行うための選択肢はCore ML以外にもいくつかあります。 TensorFlow for iOS (TensorFlow Mobile) TensorFlow Lite PyTorch Mobile (LibTorch) ただし、 TensorFlow for
https://buildersbox.corp-sansan.com/entry/2022/11/25/110000
SansanにおけるエッジAIの活用事例 - Sansan Tech Blog
研究開発部Architectグループの堤と申します。 新任マネージャーとして 自身のキャッチアップも兼ねて、研究開発部の技術や成果物について紹介する記事を書いています。 buildersbox.corp-sansan.com 第二弾となる今回は、「スマキャプ」と社内で呼んでいる技術について紹介します。スマキャプでは スマホ上で機械学習モデルの推論処理をオンデバイスで行っている ...
https://buildersbox.corp-sansan.com/entry/2022/11/01/110000
Sansanの名刺データ化技術 - Sansan Tech Blog
研究開発部 Architectグループの堤と申します。今年4月より、まったくの 門外漢だった ところから研究開発部でマネジメントを担当することになりました。入社して早6カ月が経とうとしていますが、マネジメントの面でも技術面でもまだまだ学ぶことだらけです。キャッチアップしたことの整理も兼ねて、これからしばらくの間、研究開発部の技術や成果物について紹介する記事を書いていきたいと思います。 ...
https://buildersbox.corp-sansan.com/entry/2022/10/27/110000
BERTによる日本語固有表現抽出の精度改善 〜BERT-CRFの紹介〜 - Sansan Builders Blog
こんにちは、DSOC R&Dグループ インターンの笛木正雄です。大学院では離散最適化の研究室に所属しています。インターンでは、日々、知らないことだらけで、色々なことを経験させていただき、伸びしろを実感する毎日です。 ...
https://buildersbox.corp-sansan.com/entry/2021/09/21/120000
#経済学
The Economics of Blockchain Energy Consumption: A Short Review - Sansan Tech Blog
Economics Meets Data Science Hi there!. I'm Juan, from Sansan R&D's SocSci Group. Today's post is about blockchains. Cryptocurrencies and blockchain technology have been in the spotlight for the last year. About one year ago Bitcoin was recognized as a legal tender by the first nation-state. Cryptoc...
https://buildersbox.corp-sansan.com/entry/2022/09/15/110000
Economics Meets Data Science: Reproducible Research with R - Sansan Tech Blog
At Sansan R&D we have created a set of guidelines and templates to become more productive when writing reports with R. Here I share some of what we came up with.
https://buildersbox.corp-sansan.com/entry/2022/04/21/110000
#開発
【Sansan Tech Talk】研究開発部のSRE戦略 〜MLアプリケーションの進化と保守性向上〜 - Sansan Tech Blog
こんにちは、Sansan Engineering Unit 部長の笹川裕人です。今回で8回目を迎える「Sansan Tech Talk」では、Sansanのテックリードが日々取り組んでいる技術的な課題や挑戦を深掘りしてお届けしています。今回は、研究開発部のArchitectグループで活躍する加藤慶彦にインタビューしまし…
https://buildersbox.corp-sansan.com/entry/sansan-tech-talk-randd-kato
DatadogでKubernetes(EKS)のMetricsを取得する備忘録 - Sansan Tech Blog
こんにちは!技術本部 研究開発部 Architectグループの宮地です。1年ぶりのブログ投稿になります。私は23卒として入社し、気づけば 2年目も終わりに近づいています。月日の流れは本当に早いですね。 さて、最近のトピックスとして、年明けから中部支店に異動となりました!大学時代を愛知で過ごしていたこともあり、地元に戻れ…
https://buildersbox.corp-sansan.com/entry/2024/12/17/000000
Kubernetes上に負荷試験基盤を構築した話 - Sansan Tech Blog
こんにちは、研究開発部Architectグループ ML Platformチームの藤岡です。今回はKubernetes上に負荷試験基盤を構築したので、その取り組みについて紹介しようと思います。 目次 目次 背景 負荷試験基盤の要件 負荷試験ツールの選定 負荷試験基盤のシステム概要 シナリオファイルの管理方法 Kubern…
https://buildersbox.corp-sansan.com/entry/2024/07/25/140000
Kubernetesクラスタ更新時のマニフェスト差分をGitのブランチで吸収する - Sansan Tech Blog
研究開発部 Architectグループ ML PlatformチームのKAZYこと新井です。 名古屋にある中部支店に所属しています。 Kubernetesのマニフェスト管理方法とクラスタのバージョン更新時の運用方法を変更したため、共有します。
https://buildersbox.corp-sansan.com/entry/2024/05/01/110000
gokart の環境変数周りでバグを発見したので、修正 PR を出したら爆速でリリースされた話 - Sansan Builders Blog
こんにちは。技術本部 R&D 研究員の青見です。 4月で社会に出て1年になりました。 この時期は花粉症が辛くて記憶がくしゃみにかき消されがちですが、入社式のやっていきを思い出して2年目も頑張っていきます。 さて、 R&D では積極的にパイプラインツールを使って開発しようという流れになってきており、その1つとして gokart を利用しています。 gokart は Luigi という Spotify が開発している Python のパイプラインライブラリのラッパです。 特徴として機械学習利用のパイプラインに特化しており、再現性の担保という観点では非常に Luigi と比べて使いやすく感じます。 gokart と Luigi について詳しくは同じチームの髙橋が連載で紹介しているので、ぜひそちらを御覧ください。buildersbox.corp-sansan.com 今回は実際に使用していた gokart においてバグを発見したので修正の PR を出したところ、マージ後高速でリリースされ、即座に業務で利用することが出来たという話をします。 Luigi や gokart では処理の一つひとつをタスクという単位でまとめ、パイプラインとして実行します。 このタスクやパイプライン全体に対してパラメータをうまく扱う仕組みがあり、これらのパラメータを設定ファイル (.ini ファイルなど) として管理することが出来ます。 パラメータに関する設定ファイルは、 Python built-in の configparser に準拠しており、以下のようにセクション単位で機能やタスクのパラメータを管理します。 [TaskOnKart] workspace_directory=./resources local_temporary_directory=./resources/tmp [core] logging_conf_file=./conf/logging.ini [TaskA]
https://buildersbox.corp-sansan.com/entry/2022/04/07/110000
#入社エントリー #振り返り
Beamer用の社内スライドテンプレートを作りました - Sansan Tech Blog
本記事はSansan Advent Calendar 2024の19日目の記事です。こんにちは。技術本部 研究開発部 Data Analysisグループの田柳です。大学院では計量経済学・時系列解析を研究しており、2024年4月に新卒として入社しました。本記事では、PowerPointやGoogle Slidesの社内ス…
https://buildersbox.corp-sansan.com/entry/2024/12/19/000000
【Sansan Tech Talk】研究開発の技術的挑戦 〜MLOpsの推進による開発サイクル短縮と効率化の取り組み〜 - Sansan Tech Blog
こんにちは、Sansan Engineering Unitの部長を務める、笹川 裕人です。今回で6回目となる「Sansan Tech Talk」。この連載ではSansanのテックリードたちが日々直面している技術的な課題や挑戦を深掘りしてお伝えしています。 今回は研究開発部で活躍するWebアプリエンジニアである鷹箸 孝典…
https://buildersbox.corp-sansan.com/entry/sansan-tech-talk-randd-takanohashi
2024年 研究開発部 新卒開発研修 前編 - Sansan Tech Blog
こんにちは、研究開発部Architectグループの山本です。 昨年に引き続き、研究開発部の新卒社員向けに開発研修を行いました。 今年の研修では、私自身が昨年受けた経験をもとに感じた改善点や部内での技術的なアップデートを踏まえて実施しました。 昨年の記事を読んでいない方でも分かりやすい構成にしたので、ぜひご一読ください。…
https://buildersbox.corp-sansan.com/entry/2024/07/25/110000
2024年 研究開発部 新卒開発研修 後編 - Sansan Tech Blog
こんにちは、研究開発部Architectグループの山本です。 前編に引き続き、新卒社員に対して行った研修を紹介したいと思います。 後編では、前編で開発したサービスを社内アプリケーション基盤にデプロイする内容となります。 前編はこちら buildersbox.corp-sansan.com
https://buildersbox.corp-sansan.com/entry/2024/08/09/110000
【前編】24新卒開発研修で新しいツールを導入した話 〜Ruffの導入方法と使い方など〜 - Sansan Tech Blog
こんにちは、研究開発部 Automationグループで研究員をしている李です。業務として、Bill Oneの請求書情報に関する作業効率改善に従事しています。 例年通り *1 *2 4月24日(水)~4月26日(金)で研究開発部(以下、R&D)内の技術研修を実施しました。開発環境は昨年からのアップデートとして、Ruffと…
https://buildersbox.corp-sansan.com/entry/2024/05/28/110000#f-25a50edf
【後編】24新卒開発研修で新しいツールを導入した話 〜pre-commit の導入方法と使い方など〜 - Sansan Tech Blog
こんにちは、研究開発部 Automationグループで研究員をしている李です。 本ブログでは、前編 に続き、新卒開発研修*1 *2に導入したpre-commitの使い方などを共有します。 *1:2023年 研究開発部 新卒技術研修 ~ 実践編 ~ - Sansan Tech Blog *2:2023年 研究開発部 新卒…
https://buildersbox.corp-sansan.com/entry/2024/05/28/110000_1
データプロダクト、データ活用アプリケーションを提供した未来に思いを馳せる|TakayukiSaruta
はじめに Sansan技術本部研究開発部の猿田です。2023年の6月から研究開発部で研究員として働いています。研究員といってもリサーチをして論文を書くような研究職ではなく、技術ドリブンで新しいアプリケーションや事業を作っていくようなポジションで働いています。研究開発部所属のプロダクトマネージャーと言ったほうが近いかなと思うので自己紹介ではそう言っています。Sansanに入社して約5ヶ月経過したので(早い・・・)振り返り的な意味も込めて筆を取りました。 この記事の3行まとめ ・社内データ活用とSansan Labsとグローバルビジネスに挑戦中 ・類似企業事例提供アプリを社内リリース
https://note.com/srt_taka/n/n2d1928848122
【22新卒 1年間の振り返り】第2回 畑違いの研究分野から研究開発組織に入っての1年を振り返ってみた - Sansan Tech Blog
はじめに こんにちは、技術本部 研究開発部 Data Analysisグループの金子です。ここ半年毎日コールドシャワーを浴びています。最近は覚悟を決めずとも浴びれるようになり、春を感じる今日この頃です。私がSansanに新卒入社してから一年が経ちました。本記事では、この一年間で取り組んだ仕事を振り返りながら、その中で学…
https://buildersbox.corp-sansan.com/entry/2023/03/28/110000
入社後のホンネ[技術本部 研究開発部 Automationグループ 王 汗欽] - Sansan株式会社 | 公式メディア「mimi」
入社から少し時間が経ったメンバーに、Sansanの入社についてホンネを聞き出す当企画。今回は、応募時と入社後の業務内容のギャップが一番の不安だったと語る王に、ホンネで話してもらいました。 自分が成長し、貢献できていることを日々実感 現在どんな業務をしていますか? 営業DXサービス「Sansan」のOCR技術の精度をさら…
https://jp.corp-sansan.com/mimi/2022/09/honne-06.html
#インターン
機械学習実験管理ツールの移行検討 - Sansan Tech Blog
こんにちは、技術本部 研究開発部 ML Platformチームでインターンをしていた岡部です。ML Platformチームでは、主に社内の研究員の成果を高速にリリースするための基盤であるCircuitの開発・運用を行っています。 CircuitはEKSをベースとしたシステムで、シングルクラスタの運用を行っています。Ci…
https://buildersbox.corp-sansan.com/entry/2024/12/16/150000
TerraformによるAirbyteを利用したデータ基盤へのデータ連携とCI/CD - Sansan Tech Blog
こんにちは!「Sansan Summer Internship 2023」でインターンをしていた野首侑作です(X, Facebook)。R&D Architectグループに1ヶ月強コミットしていました。今回のインターンで使った技術はこれまで全く触ったことがありませんしたが、チームメンバーのサポートもあり本番環境でも動か…
https://buildersbox.corp-sansan.com/entry/2023/09/20/110000
#レポート
MIRU2024に参加してきました - Sansan Tech Blog
こんにちは。研究開発部の今井です。 2024年8月6日(火)から8月9日(金)にかけて、熊本県熊本市にて画像の認識・理解シンポジウムMIRU2024が開催されました。弊社からは、今井・内田・関・猿田の計4名の研究員が現地に赴き、企業展示を行いました。本ブログはMIRU2024の参加レポートとなります。
https://buildersbox.corp-sansan.com/entry/2024/09/19/110000
2024年度人工知能学会に参加しました - Sansan Tech Blog
こんにちは!研究開発部の山内敏嗣です!浜松で行われた2024年度 人工知能学会全国大会 (第38回)において、企業ブースの出展、ポスター発表を行いました。 本ブログでは、その様子について紹介します。
https://buildersbox.corp-sansan.com/entry/2024/06/07/110000
同期的なコミュニケーションでチーム内の距離を縮める - Sansan Tech Blog
研究開発部 Architectグループ ML PlatformチームのKAZYこと新井です。 名古屋の中部支店に所属しています。 普段はCircuitというアプリケーション基盤を作っています。 先日、チームメンバーと同じ会議室に集まり、業務とワークショップを行いました。
https://buildersbox.corp-sansan.com/entry/2024/04/30/150000
チーム開発合宿 2024 in 徳島県神山町(レポート編) - Sansan Tech Blog
こんにちは、研究開発部 Architectグループの辻田です。 今年も神山ラボへ開発合宿に行ってきました!新メンバーも加わり、チームとしては2回目の開発合宿*1です。本記事では合宿レポートを紹介します。合宿で取り組んだ技術的な内容は別記事で出しますので乞うご期待です。 本記事は【R&D DevOps通信】という連載記事…
https://buildersbox.corp-sansan.com/entry/2024/03/25/110000
2023アドベントカレンダーの社内LT大会の開催報告:技術とチキンでつながる一夜 - Sansan Tech Blog
こんにちは。 技術本部研究開発部の高橋寛治です。 Sansan Advent Calendar 2023を書いた人達で交流と技術への理解を深めるために、社内でLT*1会を実施しました。 準備が少なくテンポ良く会として進められるため、LT形式を取りました。 また、フライドチキンや飲み物を用意し、ゆるい雰囲気で実施しました…
https://buildersbox.corp-sansan.com/entry/2024/02/08/110000
2024年の生成AIはどうなる? サイバーエージェントなどIT企業4社の“本音” 「OpenAI強すぎる問題」に活路はあるか
ChatGPTが注目を集め、生成AI導入の機運が一気に広がった2023年。日本で生成AIの開発、実装に携わるIT企業4社が生成AI活用の現状と2024年の生成AIの展望を語った。
https://www.itmedia.co.jp/news/articles/2401/29/news012.html
CCSE2023に参加しました - Sansan Tech Blog
こんにちは。研究開発部の保坂です。昨年末は久しぶりに年賀状を書いたのですが、最近は年賀状アプリも発達しており、作り始めて30分程度で発送まで手配できたことに感動しました。そのような中、2023年12月22日(金)に、東京大学の伊藤謝恩ホールにて、株式会社サイバーエージェント主催のCCSE2023が開催されました。弊社か…
https://buildersbox.corp-sansan.com/entry/2024/01/11/110000
Platformのエンジニアが行くAWS re:Invent 2023 - EKSで実現するマルチテナントSaaS編 - Sansan Tech Blog
こんにちは、技術本部研究開発部 ML Platformチームの神林です。前回はEKSのBreakout Sessionの中で気になる一部分を掘り下げてみました。 buildersbox.corp-sansan.com AWS re:Invent 2023も無事に終わりました。開催中にもう何個か記事を書きたかったのですが…
https://buildersbox.corp-sansan.com/entry/2024/01/09/110000
『一日で学ぶクラウドネイティブ技術実践ハンズオン』参加レポート - Sansan Tech Blog
こんにちは、技術本部研究開発部Architectグループ ML Platform チームの宮地です。 23年度の新卒として入社し半年以上が経過しました。時の流れは早いものです。 普段の業務ではCircuitというkubernetesを利用したアプリケーション基盤を作っています。 speakerdeck.com 社会人に…
https://buildersbox.corp-sansan.com/entry/2023/12/28/110000
Platformのエンジニアが行くAWS re:Invent 2023 - Pod Identity編 - Sansan Tech Blog
こんにちは、技術本部研究開発部 ML Platformチームの神林です。前回は技術とは関係ないULパッキングの記事を書きました。あまりにも関係なさすぎたので、今回は技術の方に振り戻そうと思います。 buildersbox.corp-sansan.com AWS re:Invent 2023も後半戦となりました。毎日6時…
https://buildersbox.corp-sansan.com/entry/2023/11/30/150000
Platformのエンジニアが行くAWS re:Invent 2023 UL海外出張 準備編 - Sansan Tech Blog
こんにちは、技術本部研究開発部 ML Platformの神林です。ML PlatformチームではCircuitというアプリケーション基盤を作っています。 さて、今年もアメリカのラスベガスで開催されるAWS re:Inventの時期がやってきました。私も社内で声をかけてもらったので行ってみることにしました。初アメリカ、…
https://buildersbox.corp-sansan.com/entry/2023/11/27/160000
Sansan R&D TECH SHOWCASE -ビジネスをドライブするR&Dのウラガワ大公開-を開催しました - Sansan Tech Blog
こんにちは、研究開発部の西田です。 週末朝9時からのバスケの練習に向かう電車の中でこの記事を執筆しています。先週の金曜日、研究開発部の取り組みを紹介するSansan R&D TECH SHOWCASEを開催しました!その興奮が冷めやらぬうちに、イベントのハイライトをお届けします! sansan.connpass.com
https://buildersbox.corp-sansan.com/entry/2023/11/14/100000
try! Swift NYCに参加してきました! #tryswiftnyc - Sansan Tech Blog
研究開発部の堤と申します。今年9月にニューヨークで開催されたtry! Swift NYCというカンファレンスに参加してきました。 www.tryswift.co try! Swiftは2016年から東京・インド・ニューヨーク等で開催されている、Swiftのデベロッパーカンファレンスです。東京での開催時は毎回参加していま…
https://buildersbox.corp-sansan.com/entry/2023/11/09/110000
MIRU2023に参加しました - Sansan Tech Blog
こんにちは。研究開発部の本田です。2023年7月25日(火)から7月28日(金)にかけて、静岡県浜松市にて画像の認識・理解シンポジウムMIRU2023が開催されました。弊社からは今年、今井・内田・猿田・本田・李の計5名の研究員が現地に赴き、企業展示に加えてポスター発表を2件行なっています。本ブログは、発表内容も併せたM…
https://buildersbox.corp-sansan.com/entry/2023/08/17/150000
2023年度人工知能学会に参加しました - Sansan Tech Blog
こんにちは、研究開発部の齋藤慎一朗です。 熊本で行われた2023年度 人工知能学会全国大会 (第37回)において、企業ブースの出展、インダストリアルセッションの発表を行いました。 本ブログでは、その様子について紹介させて頂きます。
https://buildersbox.corp-sansan.com/entry/2023/06/14/110000
NLP2023に参加・発表しました - Sansan Tech Blog
言語処理学会年次大会(NLP)とは テーマセッション「金融・経済ドメインのための言語処理」 研究発表 聴講内容 D9-2 連続時間フラクショナル・トピックモデル D10-5 監査上の主要な検討事項 (KAM) の前例踏襲の程度に関する業種別及び監査法人別の傾向分析 おわりに 参考文献 こんにちは!研究開発部の黒木裕鷹で…
https://buildersbox.corp-sansan.com/entry/2023/04/03/110000
研究開発部の名刺メーカー技術開発メンバーで京都合宿に行ってきました - Sansan Tech Blog
こんにちは、研究開発部の糟谷勇児です。 以前やっていたニューラルネット老人のブログは、CUDA沼にはまり、失踪してしまいましたので、久しぶりのブログとなります。 Sansanでは名刺メーカーという名刺作成業務をDXするサービスを展開しています。 sansan-meishi-maker.com今回はその技術開発の一環で、…
https://buildersbox.corp-sansan.com/entry/2023/02/15/110000
We joined the ASSA 2023! - Sansan Tech Blog
Hi, I'm Juan from Sansan R&D. This year started with a lot of action for us at the SocSci Group. As you may already know, we were invited to present at this year's ASSA Annual Meeting to make a presentation about the research project in which researchers Komatsu, Nishida and I, together with profess...
https://buildersbox.corp-sansan.com/entry/2023/01/25/110000
【神山通信vol.1】神山ラボで働いています - Sansan Tech Blog
こんにちは。 技術本部研究開発部の 高橋寛治 です。 徳島県名西郡神山町にあるサテライト拠点の神山ラボで10月から勤務しています。 神山ラボ勤務での日常について、ざっくばらんに紹介します。 今は徳島平野に住んでいます。 神山ラボへは車で通勤しています。 片道約50分の道のりです。通勤時間は橋など特定の場所で渋滞が発生します。 ...
https://buildersbox.corp-sansan.com/entry/2022/10/24/110000
MIRU2022 に参加してきました - Sansan Tech Blog
こんにちは。研究開発部の内田です。 気づけばもう8月ですね。 今年の初めから某人に触発されてランニングに勤しんでいるのですが、近頃は夜中でも気温26℃を下回らない日が多く、日々のトレーニングが非常に辛いです。 誰かどうにかしてください。 暦の上では大暑にあたる 7/25-7/28 の期間、 MIRU2022 にスポンサーとして参加してきましたので、本エントリでは参加レポートをお届けします。 ...
https://buildersbox.corp-sansan.com/entry/2022/08/17/110000
We Held a Global Mini-Conference! - Sansan Tech Blog
Hi there. I'm Juan, from Sansan R&D.As you may know if you follow us on social media, one important part of our work as Social Scientists at Sansan R&D is performing research. It is how we find new creative ways to understand and process the data coming from our services and turn it into new value f...
https://buildersbox.corp-sansan.com/entry/2022/07/04/110000
2022年度人工知能学会に参加しました! - Sansan Tech Blog
こんにちは、研究開発部の鈴木碩人です。 京都で行われた第36回人工知能学会全国大会(JSAI 2022)において、インダストリアルセッションの発表、企業ブースの出展、ポスター発表を行いました。 Sansanでは、これまでJSAI, DEIM, NLPなど多くの学会に企業ブースを出展しており、特にJSAIはサマーインターン・長期インターンの採用の場として力を入れて参加してきました。 ...
https://buildersbox.corp-sansan.com/entry/2022/07/13/110000
「ML勉強会」を開催しました - Sansan Builders Blog
こんにちは、DSOC 研究員の大垣です。 先日5/14(金)に開催した「ML勉強会」のレポートをお届けします。 sansan.connpass.com 発表者: 保坂 大樹(Sansan株式会社 DSOC 研究開発部 Data Analysis Group 研究員) 「レイアウトの情報を考慮した上で、文章から情報を抽出する方法」に関して、話をしていただきました。 ...
https://buildersbox.corp-sansan.com/entry/2021/05/25/110000
Econ Fiesta 2 を開催しました! - Sansan Builders Blog
こんにちは!DSOCの西田です。 昨年のベストバイだなと自負するスニーカーが2足あったにもかかわらず、もったいなくて箱からも出せていないのに、最近また今年のベストバイだなと思う厚底スニーカーを買ってしまいました。ちゃんと履こうと思います。 さて、今回は先日開催したEcon Fiesta 2の開催レポートをお届けします。 Econ ...
https://buildersbox.corp-sansan.com/entry/2021/03/12/115549
「Sansan × atmaCup #12」を開催しました - Sansan Builders Blog
本記事は, Sansan Advent Calendar 2021 第18日目の記事です. ...
https://buildersbox.corp-sansan.com/entry/2021/12/18/110000
Sansan エンジニアに関する記事
【イベントレポート】VPoEの視点で見る組織の進化 〜組織変革とグローバル連携、次世代リーダー育成の戦略〜 - Sansan Tech Blog
2024年10月9日、Sansan株式会社はイベント「VPoEの視点で見る組織の進化 〜組織変革とグローバル連携、次世代リーダー育成の戦略〜」を主催しました。イベント会場となったのは、JR渋谷駅に隣接する渋谷サクラステージ。弊社は2024年9月30日に同所へとオフィス移転したのですが、オフィスでのイベント開催は移転後初…
https://buildersbox.corp-sansan.com/entry/vpoe_talk_event
GKEのInteractive Troubleshooting PlaybookとGeminiを活用した爆速トラブルシューティング - Sansan Tech Blog
こんにちは。Strategic Products Engineering Unit SREグループの辻田です。 先日、Google Cloudさんが主催するTAP(Tech Acceleration Program)に参加してきました。2回目の参加*1となる今回は、Platformのより詳細な設計に関するディスカッショ…
https://buildersbox.corp-sansan.com/entry/2024/11/08/110000
Platform Engineering Jump Startに参加して学んだこと - Sansan Tech Blog
Google Cloudさんと弊社エンジニアたちの集合写真 こんにちは。技術本部Strategic Products Engineering Unit SREグループの辻田です。先日、Google Cloudさんが主催する「Platform Engineering Jump Start」に参加してきました。 このプログ…
https://buildersbox.corp-sansan.com/entry/2024/08/19/110000
「コード全捨て」で覚悟が決まった。Bill Oneチームが“売れない新規事業”を脱却した方法 | レバテックラボ(レバテックLAB)
新規プロダクトをつくり始めたものの、なかなか売れずに苦しんでいる開発チームも多いのではないでしょうか。伸び盛りのBill One開発チームも、実はその1つでした。チーム発足から3カ月後にアサインされた現VPoEの大西さんは一体どのようにして、プロダクトを軌道に乗せたのでしょうか。新規プロダクトの開発チームが、苦境を脱するためのヒントをいただきました。
https://levtech.jp/media/article/interview/detail_487/
内部品質の低下を「実装前」にキャッチする「設計レビュー」のすすめ【Sansan笹川】 レバテックラボ(レバテックLAB)
組織拡大による内部品質の低下を、実装の前に担保する「設計レビュー」。その目的、やり方や、開始から約1年経った今感じている成果・手応えを伺いました。
https://levtech.jp/media/article/interview/detail_470/
「エンジニア500人じゃ全然足りない」拡大と意思決定速度を両立する「自走する開発組織」とは【Sansan VPoE大西×VPoP西場】 レバテックラボ(レバテックLAB)
2024年4月、Sansanに新たなVPoEが誕生。「組織をさらに拡大しても意思決定速度は落としたくない、そのために“自走する組織”をつくりたい」と語ります。「自走する組織」とはどんな姿で、組織の拡大過程で発生しがちな課題をどう乗り越えていくのか。新旧VPoEへのインタビューです。
https://levtech.jp/media/article/interview/detail_442/
Sansan株式会社について