👨🏻‍💻 postech.work

RAG Application Engineer

Deda • 🌐 In Person

In Person Posted 1 day, 16 hours ago

Job Description

Cosa aspettarti

Siamo uno dei principali gruppi tecnologici in Italia e operiamo come Business \& Technology Accelerator di Aziende, Istituzioni Finanziarie e Servizi Pubblici, supportando l’evoluzione delle loro strategie IT e digitali. Con un ecosistema di imprese che condividono valori e visione, aiutiamo i clienti a cogliere i benefici della tecnologia, amplificandone l’impatto positivo su economia e società.

Entrerai in Istella, partner di Dedagroup, è specializzata in Big Data e Intelligenza Artificiale, con un forte focus su tecnologie di knowledge graph, data intelligence e AI generativa a supporto di soluzioni enterprise.

Entrerai in un contesto tecnologico avanzato dedicato allo sviluppo di soluzioni di Intelligenza Artificiale basate su architetture Retrieval-Augmented Generation, e di applicazioni AI integrate con Large Language Models, sistemi di ricerca e basi di conoscenza strutturate, con attenzione a qualità delle risposte, affidabilità, scalabilità e conformità normativa, per la costruzione di sistemi robusti e pronti per la produzione.

Cosa farai

Sarai coinvolto nella progettazione e nello sviluppo di pipeline RAG end-to-end, contribuendo alle fasi di retrieval delle informazioni, ranking e costruzione dei prompt.

Integrerai LLM open-source o custom con motori di ricerca, knowledge base e vector database.

Svilupperai servizi backend e API in architetture modulari e a microservizi.

Parteciperai alle attività di ottimizzazione delle performance dei sistemi in termini di qualità delle risposte, latenza e costi computazionali, oltre alla definizione di metriche di valutazione e monitoraggio continuo dei modelli e delle pipeline.

Collaborerai con team di ricerca, data engineering e prodotto sulle scelte architetturali.

Cosa ci aspettiamo da te

Laurea in discipline scientifiche, preferibilmente in Informatica o Ingegneria Informatica.

Esperienza con LLM e architetture RAG.

Familiarità con vector database e tecniche di chunking, embedding, retrieval e reranking.

Esperienza nello sviluppo di REST API, Docker e ambienti Linux.

Buona base di NLP e Information Retrieval.

Costituisce titolo preferenziale la conoscenza di search engine e framework per l’orchestrazione di applicazioni AI.

Cosa ti offriamo

Work life balance grazie a un modello di lavoro agile.

Lavoro su tecnologie all’avanguardia nel campo Search + LLM e accesso a infrastrutture GPU e modelli proprietari

Un ambiente di ricerca industriale con forte impatto applicativo, con possibilità di crescita su profetti strategici nazionali ed europei.

Get job updates in your inbox

Subscribe to our newsletter and stay updated with the best job opportunities.