Zum Inhalt springen

Engineering-Assessments für das AI-Zeitalter

Kandidat:innen arbeiten am echten Repo, mit eigenen AI-Tools. Sie klären unterspezifizierte Anforderungen über einen PO-Chatbot und liefern einen PR. Sie bewerten echte Arbeit, nicht Rätsel.

Aktuell 3 kostenlose Pilotprojekte im DACH-Raum.

Das Problem

Leetcode und klassische Take-Homes liefern kaum noch Signal.

Kandidat:innen lösen sie in 10 Minuten mit Claude oder Copilot. Sie sehen, wer ein Tool bedienen kann. Nicht, wer Probleme löst.

Der eigentliche Job eines Engineers hat sich verschoben: unklare Anforderungen verstehen, mit AI zusammenarbeiten, im Business-Kontext Entscheidungen treffen.

Genau das messen klassische Assessments nicht.

Jedes Unternehmen stellt Engineers ein, die mit AI arbeiten. Kein Unternehmen misst es sauber. Arena schließt genau diese Lücke.

Wie Arena funktioniert

Vom Klonen bis zur Rubrik

  1. 1.Kandidat klont ein echtes Repo.
  2. 2.Aufgabe ist bewusst unterspezifiziert. Ein PO-Chatbot beantwortet Rückfragen, lässt Mehrdeutigkeit aber gezielt stehen.
  3. 3.Kandidat arbeitet in eigener IDE, mit eigenen AI-Tools, im eigenen Tempo.
  4. 4.Push auf Feature-Branch, öffnet PR.
  5. 5.Wir bewerten die Arbeit und liefern Ihnen eine rubrikbasierte Auswertung.

Was gemessen wird

Signale aus echter Arbeit

  • Problemidentifikation unter Mehrdeutigkeit
  • Requirements-Klärung und Kommunikation
  • Code-Qualität unter echten Constraints
  • Entscheidungen, nicht Syntax

Fragen

Drei Dinge, die Käufer:innen wissen wollen.

Schummeln Kandidat:innen mit AI?
Schummeln wobei? AI gehört zum Job. Arena misst das, was AI nicht für sie macht: entscheiden, was gebaut wird, Mehrdeutigkeit verhandeln, eine PR-Beschreibung schreiben, die ein Review übersteht.
Wie lange dauert ein Assessment für Kandidat:innen?
60 bis 120 Minuten, im eigenen Editor, nach eigenem Zeitplan. Kein Timer. Die Stoppuhr war schon immer das falsche Signal.
Was unterscheidet Arena von HackerRank oder CoderPad?
Browser-Sandboxen testen Auswendiggelerntes. Arena testet Arbeit. Ein echtes Repo, ein bewusst unterspezifiziertes Ticket, ein PO-Chat und ein PR, den Ihr Team tatsächlich reviewen würde. Output ist einfach. Urteilsvermögen ist das, wofür Sie einstellen.

Founder · Engineer

Dominik Opwis

Nachdem ich gesehen habe, wie Kandidat:innen LeetCode-Aufgaben in 10 Minuten mit Claude lösen, habe ich klassischen Tests nicht mehr getraut. Arena ist das Assessment, das ich selbst wollen würde, wenn ich einstelle.

Basierend in Deutschland.

LinkedIn · E-Mail für Rückfragen

Pilotprojekte

Ich führe aktuell 3 kostenlose Pilotprojekte durch. Test entweder mit einem echten Bewerber oder mit einem bereits eingestellten Engineer als Kalibrierungs-Benchmark.