Software Architect, AI/ML

Autodesk

Montreal · On-site Full-time Lead CA$188k – CA$275k/yr 2mo ago

About the role

Position Overview

If you love building real systems that real customers use—and you get genuinely excited about LLMs, RAG, MCP, and agentic architectures—this role is for you.

The Applied AI team in Autodesk's Data and Process Management (DPM) organization ships Cloud‑Native AI agents that make our Product Data Management (PDM) and Product Lifecycle Management (PLM) workflows smarter and easier. This is a hands‑on architecture role where you'll design core platform patterns and also write code that lands in production. We're looking for a modern builder: Ambitious, Curious, and Practical—someone who has already shipped scalable, Cloud‑Native AI Applications to production and wants to level up further. You might have expertise in GenAI Applications, or you might have shipped traditional Machine Learning applications (recommendations, forecasting, anomaly detection) at scale and are ready to go all‑in on agentic architectures. Either way, you build for reliability, quality, and impact.

Responsibilities

Architect and build scalable, secure cloud‑native services and Agentic AI workflows that run in production
Own the GenAI/ML architecture for production agentic systems: tool‑use, orchestration, state/memory, routing, and multi‑step workflows
Define model strategy across prompting, retrieval (RAG), and fine‑tuning—making trade‑offs using measurable quality, latency, safety, and cost
Standardize tool/context integrations across internal systems using MCP‑based patterns (or equivalent approaches), enabling teams to ship faster on a shared foundation
Establish evaluation + observability standards (regression tests, monitoring, feedback loops)
Set technical direction via reference architectures, best practices, and hands‑on technical guidance across teams
Partner closely with Product, Security/Privacy, and Engineering leaders to deliver high‑impact features

Minimum Qualifications

Bachelor's or Master's degree in Computer Science, Machine Learning, Data Science, or equivalent practical experience
8+ years building cloud‑native software in production (distributed systems, APIs, data‑intensive services, reliability and operations)
4+ years delivering AI/ML‑powered systems in production
Experience with traditional ML cloud applications (training pipelines, deployment, monitoring, iteration)
Experience with LLM‑based systems (RAG, MCP, agent workflows, fine‑tuned models)
Experience with MCP or similar standardized patterns for connecting models to tools and context
Experience deploying and maintaining AI applications in production reliably, monitoring performance, and improving over time
Proficiency in Python/TypeScript/Java with strong engineering fundamentals (testing, code quality, performance, security)
Strong communication skills: you can explain trade‑offs clearly and influence decisions without relying on authority

Preferred Qualifications

Deep experience designing AI evaluation pipelines and production release strategies for AI applications
Experience with AWS/Azure/GCP and modern platform practices (containers, Kubernetes, CI/CD, observability)
Experience in PLM/PDM, manufacturing, CAD, or enterprise workflow software
Open‑source contributions, publications, or talks related to distributed systems, ML or GenAI systems

Présentation du poste

Si vous aimez développer des systèmes concrets utilisés par de vrais clients — et que les modèles de langage à grande échelle (LLM), le RAG, le MCP et les architectures agentiques vous passionnent véritablement — ce poste est fait pour vous.

L'équipe Applied AI de la division Data and Process Management (DPM) d'Autodesk développe des agents IA cloud‑native qui rendent nos workflows de gestion des données produit (PDM) et de gestion du cycle de vie des produits (PLM) plus intelligents et plus simples. Il s'agit d'un poste d'architecte sur le terrain où vous concevrez des modèles de plateforme de base et écrirez également du code qui sera déployé en production. Nous recherchons un développeur moderne : ambitieux, curieux et pragmatique — quelqu'un qui a déjà déployé en production des applications d'IA cloud‑native évolutives et qui souhaite passer au niveau supérieur. Vous possédez peut‑être une expertise dans les applications GenAI, ou vous avez peut‑être déployé à grande échelle des applications traditionnelles d'apprentissage automatique (recommandations, prévisions, détection d'anomalies) et êtes prêt à vous lancer pleinement dans les architectures agentiques. Dans tous les cas, vous développez en privilégiant la fiabilité, la qualité et l'impact.

Responsabilités

Concevoir et développer des services cloud‑native évolutifs et sécurisés, ainsi que des workflows d'IA agentique fonctionnant en production
Gérer l'architecture GenAI/ML pour les systèmes agentiques en production : utilisation des outils, orchestration, état/mémoire, routage et workflows en plusieurs étapes
Définir la stratégie de modélisation pour les prompts, la recherche (RAG) et le réglage fin, en effectuant des compromis sur la base de critères mesurables de qualité, de latence, de sécurité et de coût
Standardiser les intégrations d'outils et de contextes entre les systèmes internes à l'aide de modèles basés sur MCP (ou d'approches équivalentes), permettant ainsi aux équipes de déployer plus rapidement sur une base commune
Établir des normes d'évaluation et d'observabilité (tests de régression, surveillance, boucles de rétroaction)
Définir l'orientation technique via des architectures de référence, des bonnes pratiques et des conseils techniques concrets à l'échelle des équipes
Travailler en étroite collaboration avec les responsables Produit, Sécurité/Confidentialité et Ingénierie pour fournir des fonctionnalités à fort impact

Qualifications Minimales

Licence ou master en informatique, apprentissage automatique, science des données, ou expérience pratique équivalente
Plus de 8 ans d'expérience dans le développement de logiciels cloud‑native en production (systèmes distribués, API, services à forte intensité de données, fiabilité et opérations)
Au moins 4 ans d'expérience dans la mise en production de systèmes basés sur l'IA/ML
Applications cloud ML traditionnelles (pipelines d'entraînement, déploiement, surveillance, itération)
Systèmes basés sur les LLM (RAG, MCP, workflows d'agents, modèles affinés)
Expérience avec MCP ou des modèles standardisés similaires pour connecter des modèles à des outils et au contexte
Expérience dans le déploiement et la maintenance fiables d’applications IA en production, la surveillance des performances et l’amélioration au fil du temps
Maîtrise de Python/TypeScript/Java avec de solides bases en ingénierie (tests, qualité du code, performances, sécurité)
Solides compétences en communication : vous êtes capable d’expliquer clairement les compromis et d’influencer les décisions sans vous appuyer sur votre autorité

Qualifications Souhaitées

Expérience approfondie dans la conception de pipelines d'évaluation de l'IA et de stratégies de mise en production pour les applications d'IA
Expérience avec AWS/Azure/GCP et les pratiques modernes des plateformes (containers, Kubernetes, CI/CD, observabilité)
Expérience en PLM/PDM, fabrication, CAO ou logiciels de workflow d'entreprise
Contributions open source, publications ou conférences liées aux systèmes distribués, au ML ou aux systèmes GenAI

Skills

AIAPIAWSAzureCI/CDCloud-NativeContainersData ScienceGenAIGCPJavaKubernetesLLMMachine LearningMCPObservabilityPythonRAGTypeScript

Don't send a generic resume

Paste this job description into Mimi and get a resume tailored to exactly what the hiring team is looking for.

Get started free