Skip to main content
Back to jobs

Support Engineer - AI Server Systems

External
Tenstorrent logoTenstorrent · Tokyo, Japan
Full-timeOn-site2w ago
ComplianceLinuxTCP/IP
Cover LetterConnect

Prepare for this interview

Elite

AI-generated questions, company research, and talking points tailored to this role


Requirements

  • ハードウェア保守・障害対応に強みを持ち、現場での迅速な切り分けと対応ができる方
  • 顧客現場やデータセンター環境でのサポート業務を主体的に進められる方
  • Linuxサーバー、GPUサーバー、ネットワーク機器に関する基本的な知識と実務経験をお持ちの方
  • インシデント発生時にも冷静に状況を整理し、適切にエスカレーションできる方
  • 国内外の関係者と協力しながら、正確で丁寧なコミュニケーションができる方
  • 実務を通してAIインフラや高性能コンピューティング環境への理解を深めたい方
  • What We Need
  • AIサーバーおよび関連システム(GPUクラスタ、ストレージ、ネットワーク機器等)の保守・点検・障害対応
  • サーバー障害時の一次切り分け、オンサイト修理、部品交換
  • NOC(Network Operations Center)やリモート監視ツールを用いた稼働状況の監視およびログ分析
  • トラブル発生時のインシデントレポート作成と関係者への報告
  • ファームウェア、BIOS、ドライバの更新対応
  • 顧客向け定期点検および予防保守の計画・実施
  • エンジニアリング部門およびサポート部門と連携したエスカレーション対応
  • 保守用在庫の管理、交換部品の配送調整
  • 現場導入支援、設置・移設作業への立ち会いおよび主導
  • 日本語および英語能力
  • Required Qualifications
  • x86サーバー、特にGPUサーバーの保守経験
  • ハードウェア障害の切り分けスキル(電源、メモリ、ストレージ、PCIe、GPU等)
  • Linux環境(Ubuntu、RHEL、CentOS等)での操作経験
  • 基本的なネットワーク知識(L2/L3、TCP/IP、DHCP、IPMI)
  • 顧客現場での技術サポート経験、またはオンサイト対応経験
  • 障害対応や保守作業に関するドキュメント作成スキル
  • IPMItool、smartctl、nvidia-smi等の診断ツール使用経験
  • 英語マニュアルの読解力、および海外サポート窓口とのやり取り経験
  • 普通自動車運転免許
  • NVIDIA GPUサーバー(DGX、HGX等)やSupermicro、Inspur、Lambda等のハードウェア取り扱い経験
  • Ethernet、InfiniBand、NVLink、PCIeスイッチに関する知識
  • データセンターでの運用・保守経験
  • GPUベースのディープラーニングやAIワークロードに関する基礎知識
  • Linux shellスクリプトによる簡易自動化経験
  • What You Will Learn
  • 最先端のAIサーバーおよび高性能コンピューティング環境の運用知識
  • GPUクラスタ、ストレージ、ネットワークを含む大規模インフラの保守・トラブルシューティング実務
  • 社内エンジニアリングチームおよびグローバルサポートチームと連携した問題解決プロセス
  • AIワークロードを支えるハードウェア・システム全体の構造と運用の考え方
  • 急成長するAI・半導体業界における実践的なインフラサポートスキル
  • 本雇用契約の提示は、応募者が米国の輸出管理対象技術へアクセス可能な資格を有することを条件とする場合があります。米国輸出関連法規に基づき、特定の情報、システム、または技術へのアクセスには、市民権、永住権の状況、または必要なライセンス取得可否の確認が必要となる場合があります。

Additional Information

Tenstorrent is leading the industry on cutting-edge AI technology, revolutionizing performance expectations, ease of use, and cost efficiency. With AI redefining the computing paradigm, solutions must evolve to unify innovations in software models, compilers, platforms, networking, and semiconductors. Our diverse team of technologists have developed a high performance RISC-V CPU from scratch, and share a passion for AI and a deep desire to build the best AI platform possible. We value collaboration, curiosity, and a commitment to solving hard problems. We are growing our team and looking for contributors of all seniorities. 勤務地:東京 Tenstorrentでは、AIサーバーおよび関連インフラの安定運用を支える Support Engineer. AI Infrastrcuture を募集しています。 本ポジションでは、GPUクラスタ、ストレージ、ネットワーク機器を含むシステムの保守・障害対応・予防保守を担当し、社内外の関係者と連携しながら、高可用性なAIインフラ環境の維持に貢献していただきます。


Your Match

How well this role fits your profile.

Company Intel

What employees say

Worked at Tenstorrent? Share your experience

Interested in this role?

Apply on the company's website.

Cover LetterConnect