最前線で音声AIの未来を創るエンジニアたちの声
キャリアとしてはWEBシステム開発を20年近くやってきました。金融・不動産・自社プロダクト開発など、幅広い分野を経験してきましたが、転職を考えていた2017年頃、ちょうど自然言語処理の勉強をしていたんです。
そんな時、HmcommがVoiceContactの音声認識後の会話を要約する機能を開発したいという話を聞き、自分が学んでいたことと完全に合致したんです。当時はまだ社員10人ちょっとの小さな会社で、開発部門全員で朝会をやるような規模でしたが、「ここなら技術的な挑戦ができる」と感じて入社を決めました。
現在は大手企業グループ向けにコールセンターの会話を要約するAPIシステムの開発をリードしています。開発マネジメントから仕様設計、そしてモデル自体のチューニングまで、開発工程全般を担当しています。
お客様に使ってもらってこそのシステムだと考えております。直近の例として、PoCで使ってもらった結果、良い評価をいただき、顧客グループ全体で展開される計画があります。実際に使ってもらえるものを作れることにやりがいを感じています。
VoiceContactのPoCで地方のお客様のところに行った時、実際のコールセンターで使ってもらっている様子を初めて見たんです。オペレーターの方が電話対応している現場を見て、中にはクレーム対応で大変そうな方もいて...「こういう方々の業務をもっと楽にできたらいいな」と強く思いました。
変化の多い企業なので、変化することを楽しみ新しいことにチャレンジしたい人が向いていると思います。熱意・積極性のある人にはよりチャンスが与えられる企業風土があります。フルリモートで働けるのも魅力の一つです。
毎週金曜日の午後は、最新の論文を読んだり、新しいフレームワークを試したりしています。最近はLLMの効率的なファインチューニング手法について研究していて、LoRAやQLoRAといった手法を実験しています。
また、若手メンバーと一緒に勉強会を開催し、知識の共有も積極的に行っています。
変化を楽しみ、新しいことにチャレンジしたい人には最高の環境です。音声AIの経験は必須ではありません。むしろ、異なるバックグラウンドを持つ方が新しい視点をもたらしてくれることを期待しています。
海外で石油探査の技術職をやっていました。膨大なデータをGPUとクラスターで処理する仕事で、今思えば深層学習に近い部分もありましたね。
帰国後、新たなキャリアを模索していた時、数学が好きだったので、そこから派生してAI分野の論文を読んでいた際に興味を持ちました。AIスクールで学んだ後、研究っぽいことをしている会社を探していて、Hmcommの異音検知の研究開発というポジションに惹かれて2018年に入社しました。
現在はLLMのチューニングを中心に、より研究寄りの業務に従事しています。業界特化のための継続事前学習や、LLMの安全性に関する研究プロジェクトに携わっています。作業は幅広く、時にはお客様側の研究者の論文執筆のお手伝いをすることもあります。技術的な工夫を試して、うまくいく瞬間が楽しいですね。
異音検知では、稀な正常音に反応してしまうという問題がありました。これは論文でも問題視されていたことなんですが、ちょっとした工夫をして解決できたんです。その手法は今でも使われています。PoCで自分なりに工夫したらうまくいった、そういう瞬間が技術者として最も楽しい時です。
AIの進歩は高速で、 実装の単純化も進んでいます。 変化に順応でき、やる気と行動力が高い方が向いてい ると思います。 フルリモートで働けるのも魅力の一つです。
職場では研究活動や機械学習モデルの作成に主に取り組み、データ解析やアルゴリズム設計を通じて技術基盤の強化を目指す一方、個人の興味で10%ルールではAI応用に注力しています。具体的には、ノーコードによるプログラミング知識を必要としないAIシステム設計・構築・デザインを推進し、社内の誰もがAIサービス構築できるようになることを目的としています。
もう一つは、ローコード開発によるフルスタックエンジニアリング:フロントからバックエンド、API連携までを一貫して開発し、実用的なプロトタイプを構築しています。
5年以上SESエンジニアとして働いていましたが、お客様の指示通りに作ることに物足りなさを感じていました。本当は、もっと上流から関わって、より良い提案をしたかった。
転職活動で最も重視したのは「本当に良いものを作ろうという意識がある会社かどうか」でした。Hmcommの面接では、社員限定の情報まで開示してくれて、「この会社は隠し事をしない」と感じました。自社開発なら、企画段階から「これじゃダメだ、もっと良くできる」と言える環境があるはず。その期待通りの環境で、今は毎日が充実しています。
現在はAIオペレーター自動応答システム「Terry」の音声認識精度向上に取り組んでいます。認識された音声の誤認識パターンを分析して、実際に発話テストを繰り返しながら改善しています。
「こう変えたらどうか」と提案すると、すぐに「やってみよう」と。この自由度の高さは想像以上でした。最近の成果として、英数字の認識精度を向上させることに成功しました。特に、電話番号や製品番号など、ビジネスで重要な情報の認識精度が上がったことで、お客様からの評価も大幅に改善されました。
さらに驚いたのは、音声認識エンジンのソースコードレベルまで踏み込めること。SES時代には考えられない技術の深さです。
入社2週間目に、音声認識の精度改善について提案したときのことです。SES時代は、改善提案をしても「仕様にないから」と却下されることが多かったのですが、Hmcommでは違いました。
私の提案に対して、即座にチーム全体でディスカッションが始まり、その日のうちに実験することが決まりました。さらに印象的だったのは、CEOの三本さんが直接「面白いアイデアだね、どんどんやってみて」と声をかけてくれたこと。
人に話しかけづらいということが一切ない、フラットな組織文化が魅力です。ここでは「良いものを作る」という一点で全員がつながっている感じがします。
1から10まで教わりたい人より、自走できて新しい領域に踏み込みたい人に向いています。裁量は本当に大きいです。音声AIの経験がなくても、基礎的なプログラミング力と情熱があれば必ず活躍できます。
物流会社で最初の2年間は現場で汗を流し、VBAを使い簡単な現場改善を行いました。その後、Salesforceや情報システムの管理・開発まで独学で身につけた叩き上げのエンジニアです。
部門長に「俺がその能力持ってたら、転職するなぁ」と言われたのがきっかけで、転職活動を通してやりたいことを整理しました。クラウドかAIか迷ったけど、AIの方が新しくて面白そうだと。単純ですけど、ワクワクする方を選びました。
入社1ヵ月前の交通事故で、右手指を骨折してキーボードを6週間打てない状態でした。「音声指示でコードを書けるAIを作って仕事をします!」と言って入社前に設計書を作って送って、プラスで何を勉強したらいいか聞いていたら、「AI開発をやってもらおう」と言われました。。この柔軟さとスピード感に驚きました。独学でやってきた技術力を、最先端の現場で試せるチャンス。これを逃す手はないと思いました。
音声認識の精度向上と同時に、開発コストの大幅削減という難題に挑戦しています。GPUを使えば精度は上がるけどコストも跳ね上がる。そこでAWSの知識を総動員して、コストを1/10、うまくいけば1/20まで削減できる方法を提案しました。
具体的には、インスタンスタイプの最適化、スポットインスタンスの活用、推論処理の効率化などです。理論上のコスト削減を案を出すことで、研究&開発の実施量を増やして、当初の予定より前進した取り組みが出来ています。ハードウェアとクラウドの両面からアプローチできるのが面白いです。
驚いたのは、Hmcommが音声認識のオープンソースエンジン「Kaldi」のソースコードまで独自に修正していること。GPTなどのAPIを使うだけでもAI企業を名乗れる中で、コードの修正を行い、独自のAIを作ることが出来るところが、技術者として本当に刺激的です。
最初はフルリモートで大丈夫かと思いましたが、オンボーディングもしっかりしていて、すぐに馴染めました。最大のギャップは、技術レベルの高さと、それを共有する文化です。物流会社では「できる人」が属人化していましたが、Hmcommでは全員が知識を共有し、教え合う文化が根付いています。
「異業種出身」がハンデにならないどころか、むしろ強みとして評価されることも新鮮でした。前職の経験を活かしてコスト削減に貢献できたことで、自分の価値を再認識できました。
入社して1ヶ月目、音声認識のインフラコスト削減案をプレゼンした時、CTOが「面白い!すぐにPoCをやってみよう」と即決。独学で身につけた知識が、最先端のAI企業で認められ、実際に価値を生み出せた。この経験は、エンジニアとしての自信につながりました。
10%ルールを使って、AWSの新サービスやコスト最適化の最新手法を研究しています。特に、機械学習ワークロードに特化したインスタンスタイプの検証や、サーバーレスアーキテクチャの活用方法を探っています。
物流会社時代は、業務外での学習は「サービス残業」でしたが、今は堂々と業務時間内に勉強できる。この差は大きいです。最近では、AWS認定の機械学習専門資格の取得も目指しており、会社も全面的にサポートしてくれています。
応用情報技術者レベルの知識があって、「やることがなくなってきた」と感じている人にはぴったりです。特に、コスト感覚とプロジェクトの概念を理解している人なら、すぐに活躍できます。
異業種・独学エンジニアでも、十分に活躍できます。むしろ、異なる視点や経験が強みになります。技術が好きで、新しいことに挑戦したい気持ちがあれば、前職での「当たり前」が、ここでは「新しい価値」になることも。私のように、物流→AIという大胆なキャリアチェンジも可能です。
転職活動を始めてから、とにかくCEOからのアプローチの熱量が高かったことが印象的でした。私の場合は、転職活動開始した時点では特にAIを意識していた訳ではなく、前職でPdM的なポジションで業務をしており、前職以上に思いきりPdMに挑戦出来る場所を求めていました。
しかし、CEOと話をさせて頂くごとにAI、そしてHmcommの今後の成長性に非常に強い魅力を感じ、Hmcommへの入社を決めました。大手SIerでの安定したキャリアから、ベンチャーへの転職は大きな決断でしたが、この熱意と将来性に賭けてみたいと思いました。
Hmcommの中でも主力プロダクトであるVoice Contactを中心に開発・保守するチームのマネージャーを担当させて頂いています。Voice Contactは、基本的にお客様ごとにご要望をお伺いして、専用環境をその都度構築して導入する方式を取っており、その導入PJのPMとして従事しています。
希望していたPdMとは少し形が違いますが、このプロダクトをどのように成長させていくか、ということもPJを通して検討して推進していくということも役割の1つとして持たせて頂いているので、近い位置で業務を出来ていると感じています。
お客様の要望を直接聞き、それを製品に反映させていく過程は、まさにプロダクトマネジメントの本質だと感じています。各企業様のコールセンター業務を深く理解し、最適なソリューションを提供することで、導入企業の業務効率が平均30%改善という成果も出ています。
Hmcommで働いていて最も印象的なのは、社員の皆さん全員がプロフェッショナルだということです。未知の領域でも前向きにチャレンジしていく姿勢、何か問題が起きても、お客様目線でどう対応・解決するのがベストなのか、若手もベテランも役職も関係なく全員で対応にあたるところです。
大手SIerでは、どうしても部門間の壁や階層による意思決定の遅さがありました。しかしHmcommでは、エンジニアもビジネスサイドも一体となって、「お客様の成功」という共通目標に向かって動いています。この一体感は、少数精鋭だからこそ実現できる文化だと感じています。
特に印象的だったのは、ある大手企業への導入プロジェクトで技術的な課題が発生した時、CEOから新入社員まで全員が知恵を出し合い、48時間以内に解決策を実装したことです。この機動力は、前職では考えられませんでした。
Hmcommの魅力は、役職関係なく、ある程度業務の裁量を持たせて頂けることです。また、特に最近は強力に人事制度改革が社内で推進されていて、社員に対しての成果報酬の考え方を社員目線で考えようという動きがある点です。
入社してまだ日は浅いですが、すでにVoice Contactの新機能企画や導入プロセスの標準化など、自分の提案が実際に動き始めています。この速さとフレキシビリティは、ベンチャーならではの醍醐味です。
今、時間が少し進むだけでいろいろな生成AIを活用した事例が増えてきて、生成AIを活用出来ない組織はやがて廃れていくと感じています。この先生成AIに関する業務を意識的に取り組んで行きたい方、またその取り組みや自分の思いだったりをアピール、さらにそれを企画提案に発展させていくようなビジョンをお持ちの方、是非一緒にお願いできればと思います。
Hmcommは、まさにAIの社会実装の最前線にいます。一緒に、音声AIで世の中を変えていきましょう。
Hmcommのエンジニアチームがあなたを待っています