技術本部 研究開発部 メンバー紹介
笹川 裕人 Hirohito Sasakawa
執行役員/CTO 研究開発部 部長/Sansan Engineering Unit 部長/Data Intelligence Engineering Unit 部長/Platform Engineering Unit 部長
北海道大学大学院でコンピュータサイエンスの博士の学位を取得後、株式会社リクルートを経て、2018年4月にエムスリー株式会社へ入社。AI・機械学習チーム、SREチームなど複数チームを自らも手を動かしつつリード。2023年4月にSansan株式会社へ入社。現在はCTOおよび研究開発部 部長として全社の技術および研究開発の強化を推進している。
Automation Group
これまでにない速度と限りなく100%に近い精度、セキュリティーの確保を目指し、画像認識や機械学習などの技術を用いて、名刺やビジネス文書といった非定型でアナログな情報のデータ化を効率化・自動化する技術の研究開発に取り組む。
小林 幸司 Koji Kobayashi
研究員
大阪大学大学院理学研究科物理学専攻修了。在学中はシミュレーションや数値計算を学び、その後OCRソフトウエアの研究開発を行う。現在は画像処理や機械学習などの研究開発に従事する。Sansan Innovation Lab勤務。
発表・掲載実績
- OCR開発の続け方 [Kyoto Tech Talk #5]
- 「日本の未来と人づくり」 『イノベーションのまち』京都の可能性 ~kyoto力×技術革新×次世代~ [京都教育懇話会49回例会]
- 京都ビッグデータ活用プラットフォーム第2回会議パネルディスカッション [京都ビッグデータ活用プラットフォーム]
内田 奏 So Uchida
研究員
東京電機大学大学院工学研究科修士課程修了。在学中は深層学習を用いた画像生成・変換に関する研究に取り組む。学生時代からインターンとして名刺画像の品質およびOCR精度の改善に関する研究開発に従事。
発表・掲載実績2023/9/3 13:442026/1/1 14:33宮本 優一 Yuichi Miyamoto
研究員
メーカーや広告代理店で画像認識・機械学習の研究開発を行う。Sansan株式会社へ入社後も画像認識を用い、サービスの利便性とデータ化精度のさらなる向上を目指して研究開発を行う。趣味はロボット作り。
発表・掲載実績
- 影・反射を含む名刺画像の復元に向けた合成データセットの構築 [MIRU2025]
石井 良 Ryo Ishii
研究員
千葉大学大学院融合科学研究科情報科学専攻を修了。新卒で大手SI企業に入社し、本社R&D部門で画像認識・自然言語処理の研究開発を主導する傍ら、顧客事業へのAI/ML導入支援コンサルティングに従事。2022年にSansan株式会社へ入社し、現在はR&D部門にてMLOpsを推進しつつ内製の生成AI “Viola”の開発・展開を推進している。
発表・掲載実績
- フルスクラッチ VLM “Viola” の歩み [Sansan Tech Blog]
- 「学習」のアジリティを高める SageMaker Training Job [Findy Tools]
- 自社OCRエンジン「NineOCR」の学習効率化のため SageMaker Training を導入した話 [Sansan Tech Blog]
今井 海人 Kaito Imai
研究員
千葉工業大学大学院先進工学研究科修士課程修了。在学中は、画像復元や画像生成の研究に取り組む。現在は名刺画像の品質改善に関する研究開発に従事。
発表・掲載実績
- Vision-Language Modelによる局所構造を考慮したFew-shot画像品質評価モデル [MIRU2023]
- Iterative prompt learning for unsupervised backlit image enhancement [第60回 コンピュータビジョン勉強会@関東]
本田 悠太郎 Yutaro Honda
研究員
東京大学大学院学際情報学府先端表現情報学コース修士課程修了。在学中はスポーツ映像を利用した選手の行動予測に取り組む。Sansan株式会社では、名刺デザインの再現を目的としたデザイナー作業の支援や、名刺デザインの自動認識技術の開発に従事。現在は請求書のデータ化に用いる、アルゴリズムや機械学習技術の開発に携わっている。
発表・掲載実績
- 請求書仕分け自動化における協働アノテーション活用と技術開発 [渋谷 Biz × AI: ビジネスにおける AI 利活用 事例勉強会 第2回]
李 欣耘 Xinyun Li
研究員
東京理科大学大学院工学研究科情報工学専攻修士課程修了。在学中は、物体検出と情景内文字認識を利用した屋内現在位置推定に取り組む。2022年にSansan株式会社の内定者インターンとして、深層学習を用いた名刺画像の品質向上や、スキャンサービスの精度調査に取り組む。現在はBill Oneの請求書情報に関する作業効率の改善に携わっている。
発表・掲載実績
- バージョンが多すぎるYOLOについて語りたい [Sansan Tech Blog]
- 【後編】24新卒開発研修で新しいツールを導入した話 〜pre-commit の導入方法と使い方など〜 [Sansan Tech Blog]
- 【前編】24新卒開発研修で新しいツールを導入した話 〜Ruffの導入方法と使い方など〜 [Sansan Tech Blog]
関 雲一 Yunyi Guan
研究員
東京工業大学情報理工学院情報工学系修士課程修了。在学中は強化学習を用いた能動的3D物体認識に取り組む。内定者インターン時から名刺入力自動化のコスト削減に関する研究開発に従事。
発表・掲載実績
- Hybrid Water-Filling: Simultaneous Shadow and Reflection Removal with adaptive luminance mask [MIRU2025]
川波 稜 Ryo Kawanami
研究員
東京大学大学院学際情報学府先端表現情報学コース修士課程修了。新卒で大手通信会社に入社し、OCR・国内希少生物の分類といった画像認識に関する研究開発に従事。2025年にSansan株式会社へ入社し、現在はBill Oneにおけるデータ化エンジンの研究開発を担当。元高専生で「未踏IT人材発掘・育成事業」出身。
発表・掲載実績
- MIRU2025への参加およびキャディ株式会社との合同勉強会を開催 [Sansan Tech Blog]
難波 優駿 Yuto Namba
研究員
山口大学大学院創成科学研究科基盤科学系専攻情報科学コース修士課程修了。在学中は、深層学習を用いた画像復元や物理モデルを用いた画像処理に取り組む。現在は、深層学習を用いた名刺の画像化品質向上に関する研究開発に従事。
Data Analysis Group
機械学習、自然言語処理、画像処理といった技術を用いて、あらゆるビジネスデータを収集・解析する。多様なビジネスデータを組み合わせることで、情報抽出エンジンや検索エンジン、ニュース配信エンジンなどの構築に取り組む。
糟谷 勇児 Yuji Kasuya
グループマネジャー/研究員
早稲田大学大学院を修了後、大手精密機械メーカーに入社。R&D部門に配属され、画像処理、データ解析技術の開発などを担当。現在は研究員として名刺データを活用した認識・判別技術の開発に従事。主に、データ化ミス検出技術、名寄せ判定技術、名刺リコメンド技術の開発などを担当。
発表・掲載実績
- 部門を越えて本音で話す。Sansanの研究開発が商品化につながる理由 [Sansan公式メディア「mimi」]
- Bag of Condition Chains: 決定木をベースとした異常検出のための学習法と名刺の電子化ミス検出への応用 [第10回Webとデータベースに関するフォーラム(WebDB Forum), 2017]
- クラウドソーシングによる名刺データ化プロセスの実践 [情報処理学会デジタルプラクティス 9(4),808-822, 2018]
- 広報誌 「何かをはじめるきっかけマガジン 縁ジン」 [縁ジン, 2020]
- ビジネスと社会を牽引するR&D [人工知能 Vol.36 No.2]
吉村 皐亮 Kosuke Yoshimura
研究員
京都大学大学院情報学研究科知能情報学専攻博士前期課程修了。在学中はクラウドソーシングの品質管理法や、マルチラベル分類予測アルゴリズムの研究開発に取り組む。同博士後期課程在籍中。現在は契約書からの情報抽出エンジンの開発に携わっている。
発表・掲載実績
- 企業における基盤としてのグラフ分散表現の整備と運用 [パターン認識・メディア理解研究会(PRMU)]
- GAN の理論の最新動向 [画像処理 × 深層学習 勉強会, 2020]
- HCOMPとCrowdsourcing 2020 [機械学習勉強会, 2020]
- PCAに関する最新動向 [SIL勉強会 機械学習編, 2019]
- 大規模ネットワークにおけるノードの属性情報を利用した未知ノードのグラフ埋め込みの近似 [第22回情報論的学習理論ワークショップ, 2019]
- 【ML Tech RPT. 】第1回 Zero Shot Learning を学ぶ (1) [Sansan Tech Blog]
橋本 航 Wataru Hashimoto
研究員
九州大学大学院工学府修士課程修了。在学中は、第一原理計算に対するベイズ学習の応用研究に取り組む。奈良先端科学技術大学院大学博士後期課程在籍中。現在はメールからの情報抽出や大規模言語モデルの活用に関する研究開発に従事。
発表・掲載実績
- 送信者情報抽出のための日本語ビジネスメールデータセットの構築 [第20回言語処理若手シンポジウム(YANS2025)]
- 質問応答によるメールからの送信者情報抽出 [言語処理学会 第31回年次大会 (NLP2025)]
- メール署名取り込みにおける名刺情報抽出の取り組み [Sansan R&D TECH SHOWCASE -ビジネスをドライブするR&Dのウラガワ大公開-]
- 日本語固有表現抽出におけるBERT-MRCの検討 [言語処理学会 第28回年次大会 (NLP2022)]
- BERTを用いた固有表現抽出におけるバッチ能動学習 [NLC IPSJ-ICS合同研究会, 2021]
- ニュースに対する各種時系列トピックモデルの比較検討 [第23回情報論的学習理論ワークショップ (IBIS2020)]
- 名刺交換データ・ビジネスニュース・企業の社会的評判から見たCOVID-19の日本のビジネスへの影響 [第16回テキストアナリティクスシンポジウム, 2020]
- 時系列文書解析とコロナ禍における ニュースへの応用 [自然言語処理勉強会, 2020]
保坂 大樹 Taiju Hosaka
アシスタントグループマネジャー/プロダクトマネジャー
早稲田大学大学院修士課程修了。在学中は分散表現手法のビジネス活用について研究を行う。2020年にSansan株式会社に新卒入社。現在は、帳票の解析技術を活用し、インボイス管理サービス「Bill One」および契約データベース「Contract One」における機能開発やデータ化プロセスの改善に取り組む。
発表・掲載実績
- Contract One における契約書解析技術の開発 [CCSE2023]
- ニュース配信の最適化、データサイエンティストとして得た経験【Sansan】 [外資就活ドットコム]
- 領収書からの情報抽出における座標特徴の利用がタグ信頼度に与える影響 [第24回情報論的学習理論ワークショップ]
- 契約書データ化サービスの立ち上げに携わり学んだこと [Sansan R&D・エンジニア20卒新卒LT会]
- 人間の入力を介在した契約書データ化技術 [CCSE2020]
齋藤 慎一朗 Shinichiro Saito
研究員
東北大学大学院工学研究科修士課程修了。前職では、電力・保険・製薬など多様な業界の案件において、機械学習を用いたシステムの提案・PoC・開発・保守運用まで、各フェーズを幅広く担当。現在は、Fine-TuningしたLLMを活用したプロダクト改善を推進。Kaggle 2x(Competitions, Notebooks) Master。
発表・掲載実績2025/7/5 11:432026/1/1 14:48笛木 正雄 Masao Fueki
研究員/プロダクトマネジャー
東京工業大学工学院経営工学系修士課程修了。在学中は組合せ最適化を専攻し、ネットワークに関する最適化問題やコミュニティ検出に携わる。現在はAIを活用したBill Oneの新規機能開発に取り組む。
発表・掲載実績
- 日本語固有表現抽出におけるBERT-MRCの検討 [言語処理学会 第28回年次大会 (NLP2022)]
山内 敏嗣 Satoshi Yamauchi
研究員
京都大学大学院工学研究科電気工学専攻修士課程修了。在学中は、確率的システムの制御理論研究に取り組む。自動車メーカーでの品質保証業務や、制御システムベンダーでのベイズ統計や機械学習を活用した多変量時系列データ向けのアルゴリズム研究開発に従事。現在は契約書からの情報抽出に特化したVLMの研究開発に取り組む。
発表・掲載実績
- GITを活用した複数ページ契約書画像からの情報抽出 [第39回人工知能学会全国大会(JSAI), 2025]
Mengsay Loem
研究員
東京工業大学情報理工学院情報工学系修士課程を修了後、2024年にSansan株式会社に新卒として入社。在学中は、テキスト生成モデルのデータ拡張と大規模言語モデルの研究開発に取り組む。現在は請求書の自動データ化に関する研究開発に従事。言語処理学会第30回年次大会 (NLP2024) 優秀論文賞と若手奨励賞などを受賞。
発表・掲載実績
- 帳票VQAの舞台裏:どうやってモデルを育ててきたか [Sansan Tech Blog]
- Vision Language Modelの統合で汎用化はできるのか?タスク横断マージを試す [Sansan Tech Blog]
- 視覚的質問応答による文書情報抽出における同時多項目推論 [言語処理学会 第31回年次大会 (NLP2025)]
大田尾 匠 Sho Otao
研究員
京都大学大学院情報学研究科修士課程修了。 在学中は、最適輸送を自然言語処理に応用した手法の研究を行う。2024年に新卒としてSansan株式会社に入社し、メールからの情報抽出や、契約書の文書比較に取り組んでいる。
発表・掲載実績
- 質問応答によるメールからの送信者情報抽出 [言語処理学会 第31回年次大会 (NLP2025)]
- 最適輸送が好きな6つの理由 [Findy Engineer Lab, ◯◯が好きなn個の理由]
佐藤 勇元 Yugen Sato
研究員
明治大学大学院情報科学専攻修士課程修了。在学中は言語モデルのファッション分野への応用や、モデルの説明可能性の向上に取り組む。2025年に研究開発員としてSansan株式会社へ入社。現在は請求書からの情報抽出エンジンの精度向上に従事。
根本 颯汰 Sota Nemoto
研究員
法政大学大学院理工学研究科応用情報工学専攻修士課程修了。在学中は、深層学習を用いた、自然言語に対する固有表現やトピックなどの情報抽出技術の改善や、MR画像からアルツハイマー病を予測する深層学習モデルの解釈性向上に取り組む。現在はメールから署名情報を抽出するエンジンの研究開発に従事。
発表・掲載実績
- 送信者情報抽出のための日本語ビジネスメールデータセットの構築 [第20回言語処理若手シンポジウム(YANS2025)]
Sansan Labs Development Group
「Sansan Labs」は、新機能やアイデアをテスト版としてユーザーにいち早く届けるプロジェクト。ビジネスデータベース「Sansan」に蓄積された、名刺やビジネスデータといった多様なデータと先端技術を融合させ、実験的なアプリケーションを高速で開発・提供する。未来の営業スタイルやコラボレーションの在り方を先取りし、すでに多数の機能をSansan Labs上で公開。技術と事業の接続点に立ち、Sansanの進化と新たな価値創出をけん引している。
西田 貴紀 Takanori Nishida
グループマネジャー/研究員
グループマネジャー 兼 研究員として、社会科学分野の研究員が所属するSocSciグループのマネジメントに従事。因果推論の枠組みを用いたデータドリブンな意思決定でプロダクトのグロースをリードするプロジェクトやデータ活用で社内/プロダクトの課題を解決するプロジェクトに取り組む。データ活用機能の実験的な機能をリリースするSansan Labsのプロダクトマネジメントに従事。生成AIを活用した機能を多数リリースし、ユーザーのデータ活用を推進している。
発表・掲載実績2023/9/3 13:442026/1/1 14:54前嶋 直樹 Naoki Maejima
研究員
東京大学大学院人文社会系研究科博士課程単位取得満期退学。専攻は社会学、メディア論。主に社会ネットワーク理論を用いて、学級内のつながりから労働市場・結婚市場までを幅広く研究。現在は、名刺交換ネットワークの価値を最大化する新サービスの研究開発に従事している。
発表・掲載実績2023/9/3 13:442026/1/1 14:55黒木 裕鷹 Yutaka Kuroki
研究員
東京理科大学大学院工学研究科修士課程を修了。2020年にSansan株式会社へ入社。現在は企業データのドメイン横断的な分析・利用や、Sansan Labsアプリケーションの開発に従事。2018年度統計関連学会連合大会 優秀報告賞、2022年度人工知能学会金融情報学研究会 (SIG-FIN) 優秀論文賞などを受賞。
発表・掲載実績2023/9/3 13:442026/1/1 14:59Architect Group
研究員と連携し、モデル開発以外の全領域を担ってサービスの立ち上げを推進する。MLOps・Platform Engineering領域で横断的に設計・実装・運用をリードし、研究開発の生産性と信頼性の向上に取り組む。
高橋 寛治 Kanji Takahashi
グループマネジャー
長岡技術科学大学大学院工学研究科修士課程電気電子情報工学専攻修了。2017年4月にSansan株式会社へ入社し、研究員として自然言語処理分野の研究開発に従事。現在はArchitect Groupとして研究開発活動の強化を担う。
発表・掲載実績2024/7/1 14:032026/1/1 15:00島 貴宏 Takahiro Shima
R&Dエンジニア/テクニカルリード
大学院での専攻やOSSで培ったコンピュータビジョンの経験を買われ、2013年、Sansan株式会社で最初の研究開発組織の発足にあたり参画。以来、名刺や請求書のデジタル化に関する要素技術の研究開発、システム基盤の設計・開発、運用、DevOps/MLOpsなどに幅広く携わる。
発表・掲載実績
- 【R&D DevOps通信】Google Compute Engine + GPUで動作するMLサービスの基盤を刷新した話(完結編) [Sansan Tech Blog]
- 【R&D DevOps通信】Google Compute Engine + GPUで動作するMLサービスの基盤を刷新した話(技術選定編) [Sansan Tech Blog]
- 【R&D DevOps通信】研究開発部の.NET基盤をご紹介 [Sansan Tech Blog]
- 【R&D DevOps通信】GitHub Actions の Problem Matchers でコード中に注釈を入れる (flake8を例に) [Sansan Tech Blog]
- 【R&D DevOps通信】GitHub Actions: コメント駆動のワークフローを作る [Sansan Tech Blog]
野首 侑作
Yusaku Nokubi
DevOps/MLOpsエンジニア
名古屋工業大学大学院情報工学系プログラム博士前期課程修了。手描き画像からの3次元シーン復元について研究。在学中にスタートアップでクラウドマネージドサービスを利用した機械学習サービスをリリース。2025年にDevOps/MLOpsエンジニアとして新卒入社。現在は、研究開発部が抱えるサービスの整理やベストプラクティスの確立を推進している。
発表・掲載実績
- TerraformによるAirbyteを利用したデータ基盤へのデータ連携とCI/CD [Sansan Tech Blog]
上田 昂明 Koumei Ueda
DevOpsエンジニア
専門学校在学中にスタートアップにてバックエンドのリアーキテクト業務を経験。2025年にDevOps/MLOpsエンジニアとしてSansan株式会社へ新卒入社。現在は社内のEKS基盤(Circuit)の運用やコスト削減、監視の最適化を行っている。
発表・掲載実績
- マルチプロダクトのインフラアーキテクチャ特集:6社の設計思想と技術選定 [Findy Tools]
- Sansanのマルチプロダクト インフラアーキテクチャ [Findy Tools]
- やたら長いバッチの実行時間を大幅に削減した話 [Sansan Tech Blog]
- ArgoCD Image Updaterから内製ツールに移行した話 [Sansan Tech Blog]
相馬 翔大 Shota Soma
R&Dエンジニア
東邦大学大学院理学研究科博士後期課程修了。AI系のテック企業にデータサイエンティストとして入社し、モデル開発やデータ基盤、MLOpsなど幅広く担当。2025年にSansan株式会社に入社し、DevOps/MLOpsなどに携わる。
Data Direction Group
全社規模でのデータ利活用の促進や、新規事業のデータプロダクトのグロースに取り組む。アナリティクスからデータエンジニアリングはもちろんのこと、プリセールスやカスタマーサクセスといった職種まで担い、目的達成のためには役割に縛られることなく、成果を出すことに情熱を注いでいる。
小松 尚太 Shota Komatsu
研究員
東京大学大学院農業・資源経済学専攻修士課程修了。開発経済学と因果推論を学ぶ。卒業後、インターンとしてコートジボワールの国際農業研究機関に在籍。稲作農民を対象としたフィールドワークや分析、作物多様化に関する調査など、サブサハラ・アフリカにおける農業研究に従事。2020年、Sansan株式会社に新卒として入社し、現在はネットワーク経済学の応用を研究する。
発表・掲載実績2024/7/1 13:132026/1/1 15:03猿田 貴之 Takayuki Saruta
Sansan事業部 プロダクト室副室長/研究員
慶應義塾大学院修士課程修了。新卒でメーカーのR&D部門でコンピュータビジョン、機械学習関連の研究開発などに従事。その後スタートアップ2社でテクニカルプロダクトマネジャーやエンジニアリングマネジャーを経験して2023年6月にSansan株式会社へ入社。現在はSansan事業部プロダクト室副室長兼研究員として、ビジネスデータベース「Sansan」のデータ群から新しい価値を生み出すべく、データの連携から活用まで、幅広くプロダクトマネジメントに従事。
発表・掲載実績
- MCPサーバーはSaaSをどう変えるのか [note]
- 今だからこそ、Sansanで挑戦するデータ活用の最前線 [note]
- 営業DXのためのアプリケーション提供で見えてきたデータ活用、データプロダクトマネジメント [Sansan R&D TECH SHOWCASE-ビジネスをドライブするR&Dのウラガワ大公開-]
牧野 真成 Masanari Makino
データエンジニア
慶應義塾大学大学院理工学研究科開放環境科学専攻では、組込みシステム用プロセッサの仮想化用ハイパーバイザ設計とリアルタイムOSの設計・実装に取り組む。在学中は、医療データ解析やiOS・Webアプリケーション開発などにインターンやアルバイトで従事。2023年9月にSansan株式会社に入社し、現在はデータエンジニアとして働いている。
森吉 剣進 Kenshin Moriyoshi
データエンジニア
東京都立大学大学院システムデザイン研究科情報科学域博士前期課程修了。在学中にレコメンデーションに用いる人工データ生成に関する研究に取り組む。2024年にSansan株式会社に新卒として入社。現在は社内の全社データ基盤の開発とデータ利活用の推進、および社外向けデータプロダクトの開発に携わっている。
登壇・掲載実績
- 事業フェーズの違いから見る データ利活用と今後の展望 [Findy Job LT]
金髙 右京 Ukyo Kanetaka
研究員
早稲田大学政治学研究科修士課程を修了。在学中は、国際政治学や政治学方法論(ベイズ統計モデリング・因果推論)の研究に取り組む。2024年にSansan株式会社へ新卒として入社し、データアナリスト/アナリティクスエンジニアとしてデータ基盤の整備から分析・効果検証まで、データ利活用に関する一連のプロセスを幅広く担う。
登壇・掲載実績
- ベイジアン操作変数法でA/Bテストをしよう [Sansan Tech Blog]
- Researcher’s Dilemma: 実務におけるデータ利活用のあり方をさぐる [Delight Biz×Analytics Night #5]
永井 僚 Ryo Nagai
データエンジニア
明治大学大学院先端数理科学研究科博士前期課程修了。在学中にスタートアップでデータ分析基盤の構築から運用を経験。2025年にデータエンジニアとしてSansan株式会社へ新卒入社。現在は次世代データ基盤のアーキテクチャ設計・構築や各プロダクトのデータ利活用支援に従事。
