Skip to content
mimi

Software Architect, AI/ML

Autodesk

Montreal · On-site Full-time Lead CA$188k – CA$275k/yr Today

About the role

Position Overview

If you love building real systems that real customers use—and you get genuinely excited about LLMs, RAG, MCP, and agentic architectures—this role is for you.

The Applied AI team in Autodesk's Data and Process Management (DPM) organization ships Cloud‑Native AI agents that make our Product Data Management (PDM) and Product Lifecycle Management (PLM) workflows smarter and easier. This is a hands‑on architecture role where you'll design core platform patterns and also write code that lands in production. We're looking for a modern builder: Ambitious, Curious, and Practical—someone who has already shipped scalable, Cloud‑Native AI Applications to production and wants to level up further. You might have expertise in GenAI Applications, or you might have shipped traditional Machine Learning applications (recommendations, forecasting, anomaly detection) at scale and are ready to go all‑in on agentic architectures. Either way, you build for reliability, quality, and impact.

Responsibilities

  • Architect and build scalable, secure cloud‑native services and Agentic AI workflows that run in production
  • Own the GenAI/ML architecture for production agentic systems: tool‑use, orchestration, state/memory, routing, and multi‑step workflows
  • Define model strategy across prompting, retrieval (RAG), and fine‑tuning—making trade‑offs using measurable quality, latency, safety, and cost
  • Standardize tool/context integrations across internal systems using MCP‑based patterns (or equivalent approaches), enabling teams to ship faster on a shared foundation
  • Establish evaluation + observability standards (regression tests, monitoring, feedback loops)
  • Set technical direction via reference architectures, best practices, and hands‑on technical guidance across teams
  • Partner closely with Product, Security/Privacy, and Engineering leaders to deliver high‑impact features

Minimum Qualifications

  • Bachelor's or Master's degree in Computer Science, Machine Learning, Data Science, or equivalent practical experience
  • 8+ years building cloud‑native software in production (distributed systems, APIs, data‑intensive services, reliability and operations)
  • 4+ years delivering AI/ML‑powered systems in production
  • Experience with traditional ML cloud applications (training pipelines, deployment, monitoring, iteration)
  • Experience with LLM‑based systems (RAG, MCP, agent workflows, fine‑tuned models)
  • Experience with MCP or similar standardized patterns for connecting models to tools and context
  • Experience deploying and maintaining AI applications in production reliably, monitoring performance, and improving over time
  • Proficiency in Python/TypeScript/Java with strong engineering fundamentals (testing, code quality, performance, security)
  • Strong communication skills: you can explain trade‑offs clearly and influence decisions without relying on authority

Preferred Qualifications

  • Deep experience designing AI evaluation pipelines and production release strategies for AI applications
  • Experience with AWS/Azure/GCP and modern platform practices (containers, Kubernetes, CI/CD, observability)
  • Experience in PLM/PDM, manufacturing, CAD, or enterprise workflow software
  • Open‑source contributions, publications, or talks related to distributed systems, ML or GenAI systems

Présentation du poste

Si vous aimez développer des systèmes concrets utilisés par de vrais clients — et que les modèles de langage à grande échelle (LLM), le RAG, le MCP et les architectures agentiques vous passionnent véritablement — ce poste est fait pour vous.

L'équipe Applied AI de la division Data and Process Management (DPM) d'Autodesk développe des agents IA cloud‑native qui rendent nos workflows de gestion des données produit (PDM) et de gestion du cycle de vie des produits (PLM) plus intelligents et plus simples. Il s'agit d'un poste d'architecte sur le terrain où vous concevrez des modèles de plateforme de base et écrirez également du code qui sera déployé en production. Nous recherchons un développeur moderne : ambitieux, curieux et pragmatique — quelqu'un qui a déjà déployé en production des applications d'IA cloud‑native évolutives et qui souhaite passer au niveau supérieur. Vous possédez peut‑être une expertise dans les applications GenAI, ou vous avez peut‑être déployé à grande échelle des applications traditionnelles d'apprentissage automatique (recommandations, prévisions, détection d'anomalies) et êtes prêt à vous lancer pleinement dans les architectures agentiques. Dans tous les cas, vous développez en privilégiant la fiabilité, la qualité et l'impact.

Responsabilités

  • Concevoir et développer des services cloud‑native évolutifs et sécurisés, ainsi que des workflows d'IA agentique fonctionnant en production
  • Gérer l'architecture GenAI/ML pour les systèmes agentiques en production : utilisation des outils, orchestration, état/mémoire, routage et workflows en plusieurs étapes
  • Définir la stratégie de modélisation pour les prompts, la recherche (RAG) et le réglage fin, en effectuant des compromis sur la base de critères mesurables de qualité, de latence, de sécurité et de coût
  • Standardiser les intégrations d'outils et de contextes entre les systèmes internes à l'aide de modèles basés sur MCP (ou d'approches équivalentes), permettant ainsi aux équipes de déployer plus rapidement sur une base commune
  • Établir des normes d'évaluation et d'observabilité (tests de régression, surveillance, boucles de rétroaction)
  • Définir l'orientation technique via des architectures de référence, des bonnes pratiques et des conseils techniques concrets à l'échelle des équipes
  • Travailler en étroite collaboration avec les responsables Produit, Sécurité/Confidentialité et Ingénierie pour fournir des fonctionnalités à fort impact

Qualifications Minimales

  • Licence ou master en informatique, apprentissage automatique, science des données, ou expérience pratique équivalente
  • Plus de 8 ans d'expérience dans le développement de logiciels cloud‑native en production (systèmes distribués, API, services à forte intensité de données, fiabilité et opérations)
  • Au moins 4 ans d'expérience dans la mise en production de systèmes basés sur l'IA/ML
  • Applications cloud ML traditionnelles (pipelines d'entraînement, déploiement, surveillance, itération)
  • Systèmes basés sur les LLM (RAG, MCP, workflows d'agents, modèles affinés)
  • Expérience avec MCP ou des modèles standardisés similaires pour connecter des modèles à des outils et au contexte
  • Expérience dans le déploiement et la maintenance fiables d’applications IA en production, la surveillance des performances et l’amélioration au fil du temps
  • Maîtrise de Python/TypeScript/Java avec de solides bases en ingénierie (tests, qualité du code, performances, sécurité)
  • Solides compétences en communication : vous êtes capable d’expliquer clairement les compromis et d’influencer les décisions sans vous appuyer sur votre autorité

Qualifications Souhaitées

  • Expérience approfondie dans la conception de pipelines d'évaluation de l'IA et de stratégies de mise en production pour les applications d'IA
  • Expérience avec AWS/Azure/GCP et les pratiques modernes des plateformes (containers, Kubernetes, CI/CD, observabilité)
  • Expérience en PLM/PDM, fabrication, CAO ou logiciels de workflow d'entreprise
  • Contributions open source, publications ou conférences liées aux systèmes distribués, au ML ou aux systèmes GenAI

Requirements

  • Bachelor's or Master's degree in Computer Science, Machine Learning, Data Science, or equivalent practical experience
  • 8+ years building cloud-native software in production (distributed systems, APIs, data-intensive services, reliability and operations)
  • 4+ years delivering AI/ML-powered system in production
  • Traditional ML cloud applications (training pipelines, deployment, monitoring, iteration)
  • LLM-based systems (RAG, MCP, Agent workflows, fine-tuned models)
  • Experience with MCP or similar standardized patterns for connecting models to tools and context
  • Experience with deploying and maintaining AI Applications in production reliably, monitoring performance, and improving over time
  • Proficiency in Python/TypeScript/Java with strong engineering fundamentals (testing, code quality, performance, security)
  • Strong communication skills: you can explain tradeoffs clearly and influence decisions without relying on authority

Responsibilities

  • Architect and build scalable, secure cloud-native services and Agentic AI workflows that run in production
  • Own the GenAI/ML architecture for production agentic systems: tool-use, orchestration, state/memory, routing, and multi-step workflows
  • Define model strategy across prompting, retrieval (RAG), and fine-tuning—making tradeoffs using measurable quality, latency, safety, and cost
  • Standardize tool/context integrations across internal systems using MCP-based patterns (or equivalent approaches), enabling teams to ship faster on a shared foundation
  • Establish evaluation + observability standards (regression tests, monitoring, feedback loops)
  • Set technical direction via reference architectures, best practices, and hands-on technical guidance across teams
  • Partner closely with Product, Security/Privacy, and Engineering leaders to deliver high-impact features

Benefits

annual cash bonusesstock grantscomprehensive benefits package

Skills

AIAPIAWSAzureCI/CDCloud-NativeContainersData ScienceGenAIGCPJavaKubernetesLLMMachine LearningMCPObservabilityPythonRAGTypeScript

Don't send a generic resume

Paste this job description into Mimi and get a resume tailored to exactly what the hiring team is looking for.

Get started free