Hiring Profile

AI Systems Engineer / AI Architect

Applied AI infrastructure role. Backbone of the product.

1. Context

This product is a long-term cognitive system. The LLM is the muscle; the memory layer is the brain. Every conversation deepens a structured model of the user (goals, patterns, reflections) across years, not turns. We are building locally-first on existing hardware (Hostinger VPS + RTX 5090 workstation), with paid APIs as a small fallback.

2. Ownership

3. Skills required

Must have

AreaWhat we need
PythonDeep. Async, type hints, packaging, debugging at the framework level.
LLM systemsProduction experience with Claude / GPT APIs and local LLM inference (vLLM, Ollama, llama.cpp). Understands tokenization, quantization, KV cache, context window economics.
RAG / memory systemsBuilt one before. Knows where naive RAG falls apart. Has opinions on chunking, retrieval scoring, dedup, and write-time vs read-time abstraction.
EmbeddingsHands-on with multiple providers (Voyage, OpenAI) and local models (bge-large, nomic-embed). Knows the MTEB trade-offs.
Vector searchpgvector in production. Knows IVF vs HNSW, index tuning, hybrid search with BM25.
Orchestration frameworksLangGraph or equivalent (Letta, custom). Can wire stateful multi-step AI pipelines without turning them into spaghetti.
Production AI systemsHas shipped LLM-based systems to real users. Understands rate limits, retries, streaming, idempotency, and failure modes the typical web engineer misses.
PostgreSQLComfortable with schema design, migrations, query optimization. We run Postgres + pgvector self-hosted.
EvaluationKnows how to build eval harnesses for LLM outputs. Has used LLM-as-judge and human-in-the-loop evals. Has opinions on golden datasets.
Observability for AILangSmith, Langfuse, or custom tracing. Can debug "why did the AI say that?" from logs.
Self-hosted opsDocker, systemd, Nginx, Cloudflare Tunnel. We run our own stack on a VPS + workstation.

4. Profile fit

You are:

5. Not a fit

You are probably not the right person if:

6. Interview signal

We will look for:

Think this is you? We would love to hear from you.

Apply Now
Profilo di Ricerca

AI Systems Engineer / AI Architect

Ruolo di infrastruttura AI applicata. Spina dorsale del prodotto.

1. Contesto

Questo prodotto è un sistema cognitivo a lungo termine. L'LLM è il muscolo; il livello di memoria è il cervello. Ogni conversazione arricchisce un modello strutturato dell'utente (obiettivi, schemi, riflessioni) nell'arco di anni, non di singoli scambi. Costruiamo in ottica local-first su hardware esistente (VPS Hostinger + workstation RTX 5090), con le API a pagamento come piccolo fallback.

2. Responsabilità

3. Competenze richieste

Indispensabili

AreaCosa ci serve
PythonAvanzato. Async, type hints, packaging, debugging a livello di framework.
Sistemi LLMEsperienza in produzione con le API di Claude / GPT e con l'inferenza di LLM in locale (vLLM, Ollama, llama.cpp). Comprende tokenizzazione, quantizzazione, KV cache, economia della context window.
Sistemi RAG / di memoriaNe ha già costruito uno. Sa dove la RAG ingenua si rompe. Ha opinioni su chunking, scoring del retrieval, deduplicazione e astrazione in scrittura vs in lettura.
EmbeddingsEsperienza pratica con più provider (Voyage, OpenAI) e modelli locali (bge-large, nomic-embed). Conosce i trade-off del benchmark MTEB.
Ricerca vettorialepgvector in produzione. Conosce IVF vs HNSW, tuning degli indici, ricerca ibrida con BM25.
Framework di orchestrazioneLangGraph o equivalenti (Letta, soluzioni custom). Sa costruire pipeline AI stateful multi-step senza trasformarle in spaghetti code.
Sistemi AI in produzioneHa portato in produzione sistemi basati su LLM per utenti reali. Comprende rate limit, retry, streaming, idempotenza e le modalità di errore che il tipico web engineer si lascia sfuggire.
PostgreSQLA suo agio con progettazione dello schema, migrazioni, ottimizzazione delle query. Usiamo Postgres + pgvector self-hosted.
ValutazioneSa costruire harness di valutazione per gli output degli LLM. Ha usato valutazioni LLM-as-judge e human-in-the-loop. Ha opinioni sui golden dataset.
Osservabilita per l'AILangSmith, Langfuse o tracing custom. Sa fare debug di «perché l'AI ha detto questo?» dai log.
Operations self-hostedDocker, systemd, Nginx, Cloudflare Tunnel. Gestiamo il nostro stack su VPS + workstation.

4. Profilo ideale

Tu sei:

5. Non adatto

Probabilmente non sei la persona giusta se:

6. Cosa valuteremo al colloquio

Cercheremo:

Pensi di essere tu? Ci piacerebbe sentirti.

Candidati ora