Die Zukunft von Coding Agents: Nicolay Gerold über AMP, KI-Architektur & Vibe Coding

Shownotes

In dieser Folge von 'Blick ins Kontextfenster' spricht Tommy Falkowski mit Nicolai Gerold, Mitentwickler des Coding Agents Amp, über die Zukunft der KI-gestützten Softwareentwicklung. Es geht um Coding Agents, Vibe Coding, Softwarearchitektur und die Frage, wie KI die Arbeit von Entwickler:innen verändert.

Nicolai gibt Einblicke in die Entwicklung von Amp, erklärt warum gute Architektur trotz KI immer wichtiger wird und spricht über Open Source, AI-Modelle und Deutschlands Herausforderungen im KI-Wettbewerb.

🔹 Host: Tommy Falkowski – Fraunhofer IEM 🔗 LinkedIn: https://www.linkedin.com/in/tommy-falkowski/

Transkript anzeigen

00:00:00: Hallo und herzlich willkommen zu Blick ins Kontextfenster.

00:00:03: Im heutigen Interview spreche ich mit Nikola Gerold von AMP, dem Porsche unter den Codingagenten.

00:00:10: Viel Spaß mit dem Internet!

00:00:18: Ja, hi Nikolaj!

00:00:20: Vielen Dank dass du dir die Zeit nimmst heute mit mir hier zu sprechen.

00:00:24: Ich habe ja schon mit Thorsten gesprochen da er ja auch mit dir zusammen Amp entwickelt.

00:00:28: aber ich glaube du hast nochmal einen eigenen Blick auf die Dinge und bevor wir starten mit den technischen Fragestellungen erzähl doch mal ein bisschen was über dich.

00:00:39: Yes, Thorsten ist ein guter Kollege von mir.

00:00:41: Thorsten is auch der der mich tatsächlich zur Source Girl vor dazu amt gebracht hat oder das angestoßen hat, dass ich zuher komme.

00:00:49: Ich... wie gesagt Nikolai!

00:00:52: Ich bin bei AMP als Software-Engineer war davor eigentlich hauptsächlich selbstständig seit der Uni.

00:00:58: Bin glücklicherweise im Jahr twohundneinzehn in meiner Unizeit über LLMs gestolpert und habe mich möglichst früh eigentlich direkt drauf spezialisieren und hab dann erst frei beruflich gearbeitet, modellige Feindchen hier und fahre einfach so Bankenversicherung in Deutschland dann eigene letztendlich eine Agentur gegründet.

00:01:18: Und haben AI-Systeme für Unternehmen entwickelt, erst hauptsächlich in Deutschland und dann überzeiten wir mehr in UK und US und das war dann lange Zeit der Hauptfokus so oft die deutschen Firmen für uns ein bisschen zu langsam waren.

00:01:37: Hat sich doch nicht wirklich geändert?

00:01:39: Ja, man ist immer sehr frustrierend.

00:01:40: was als Entwickler.

00:01:41: Man will etwas machen und dann fragt man da und wartet erstmal drei vier Monate bis man Datenzugang hat.

00:01:46: auf der einen Seite schön weil man wird trotzdem bezahlt auf die anderen Seite aber auch frustrieren.

00:01:51: du machst ja echt die ganze Zeit gar nichts.

00:01:54: Aber spannend dass du sagst zeigtausend neunzehnte warst ihr wirklich sehr sehr früh bei dem Thema, wenn man ehrlich ist.

00:01:59: Also so richtig im Mainstream gelandet es natürlich mit ChatGPT Ende zwanzig-zweiundzwanzig.

00:02:05: das heißt da hattest du dann wahrscheinlich mit so Modellen wie BIRD und so gearbeitet oder?

00:02:11: Ja BIRd!

00:02:12: Und es gab tatsächlich auch ein paar Microsoft-Modelle die auch basieren auf den Early Transformer Architektur die eigentlich so die...mit die ersten richtigen LLMs waren dann halt GPT III und wir haben dann in der Uni einen Hackathon mit organisiert, mit OpenAI.

00:02:31: Mit GPT-III, ich glaub das war dann ... ... zwanzigzwanzig, einundzwanziger so was und daran halt noch mehr reingekommen.

00:02:39: Ich weiß diesen Hackathon noch, ich hab da auch mitgemacht... Und man hockt zu dorthen und die meisten sagen hey der Output ist, ich krieg die ganze Zeit nur Kacke.

00:02:47: Also jeder hat seine Applications gebaut und die Meisten waren in einem Track wo man für Doktoren eine App gebaut hat um die Patienten Kommunikation einfacher zu machen Und die meisten sind so verzweifelt.

00:02:57: Hey, der Output ist halluciniert die ganze Zeit.

00:02:59: Er findet irgendwas, das was uns die Erde danach auch immer noch hatte.

00:03:02: und ich bin da schon dort und denke, es ist Magie!

00:03:05: Ich weiß es ist geiles Klingel.

00:03:06: Es ist so geil.

00:03:08: Ja

00:03:09: Ja absolut, ich bin da selber ja super fasziniert auch.

00:03:12: und jetzt später als du zu dem Thema gekommen.

00:03:16: Ich bin ja von Haus aus eigentlich gar kein Software-Entwickler sondern Maschinenbauer.

00:03:19: aber mit JetGBT und auch den Stable Diffusion Sachen die ich davor ausprobiert habe bin ich dann halt komplett ins Rabbit Hole abgetaucht und sehr, sehr fasziniert von der Technologie.

00:03:34: Es öffnen sich natürlich jetzt auch immer mehr Fragestellungen.

00:03:37: Das heißt aber bei AMP bist du dann auch insbesondere so zuständig für das Thema Integration der Modelle, was man da, sag ich mal rausholen kann.

00:03:45: noch oder machst du da eher ein klassisches Software Engineering?

00:03:50: All over the place würde ich sagen.

00:03:51: also... Man ist so ein bisschen überall nachdem wir ein kleines Team sind vor allem vergleich zu den Labs zum Beispiel in Thropic.

00:03:59: Wir sind nur zwanzig Leute.

00:04:02: Deswegen hast du jetzt nicht nur einen Aufgabenbereich und du machst nichts anderes.

00:04:08: Ich füge sie mich schon stark auf die Modellseite, was vor allem wie man das nennt ist, das Harnes Tuning also letztendlich die Definition von den verschiedenen Tools die das Modell hat Wie das Kontext-Engineering funktioniert, also wie wird eingelesen.

00:04:27: Auch zum Beispiel Handoff habe ich gebaut.

00:04:28: Also ich bin sehr stark modellseitig unterwegs auch unsere IWAS aber letztendlich auch Software Engineering und ich glaube dass es halt vor allem bei Coding Agents wenn du den Output nicht wirklich evaluieren kannst als du selber Software Entwickler bist ist es sehr schwer ein Coding Agent zu bauen weil letztendling nicht weiß hey ist der output gut oder schlecht.

00:04:53: Oder vielmehr nur, und zwar die Modelle immer besser werden.

00:04:59: Es entwickelt sich mehr von hey ist die syntax correct so jetzt?

00:05:02: Ist es eine richtig gute Architektur?

00:05:04: Ist an der richtigen Stelle?

00:05:07: Ist das performant?

00:05:08: Habe ich irgendwo ne Memory League?

00:05:10: also die Probleme, die die Modellen lösen wollen gehen immer ins Komplexere und mehr in dieses was früher eben oder vor allem ersten Modellen sehr, sehr auf der menschen Seite immer noch war.

00:05:23: Ja okay das ist sicherlich jetzt auch ein Thema wo extrem viele natürlich dran arbeiten und einen Interesse haben.

00:05:30: also einerseits merkt man dass wird ja immer mehr auch in die modelle reintrainiert dass sie dann auf bestimmte sachen achten dass wir einfach sehr sorgsam sind um teilweise so über vorsichtig mit den mit der fehlerkorrektur und sowas mit dem mit try catch mechanismen und sonst was Aber das Spannende, da finde ich natürlich die Fragestellung.

00:05:51: Wie schafft man es wirklich hinterher einzuschätzen?

00:05:55: Ist die Architektur, die da jetzt gebaut wird?

00:05:57: ist sie gut.

00:05:59: Man kann natürlich immer davon ausgehen dass vielleicht ein Experte das benutzt.

00:06:02: dann weiß man okay der Experte kann es noch am Ende evaluieren.

00:06:04: aber das Ziel ist ja schon, dass man immer mehr auch das Tooling und die KI damit beauftragt das auch direkt richtig zu machen oder?

00:06:15: Das ist das Ziel.

00:06:16: ja!

00:06:18: Davon, ich glaube tatsächlich vor kurzem relativ großen Sprung.

00:06:21: Vor allem mit den OpenAI Modellen GPT-Five Point Three Codex wo dieses Verhalten von dem Modell dass viele Menschen eigentlich nicht wollten das ist wirklich sehr lange erst mal Dateien liest und drüber nachdenkt was vielen Leuten eben nicht gefallen hat eigentlich jetzt endlich dafür gesorgt hat dass das Modell besseren Code produziert und vor allem eine bessere Architektur letztendlich auch sehr stark darauf passieren, dass das Modell mehr von der Codebase sieht.

00:06:56: Weil es mehr Dateien dieste aber auch viel länger in diesen Thinking Blocks also im Denken so Probe Lösungen formuliert.

00:07:05: Also wenn man sich als Nutzer wirklich mal hinhockt und diese Thinking Blocks nießt, es formuliert Lösungen oder mehrere verschiedene Möglichkeiten.

00:07:14: Und das ist quasi so die Designphase auf dem Modell, da ich überlegt, hey wo platziere ich das?

00:07:18: Was ist der richtige Name für eine Funktion?

00:07:22: Wie integriere ich dies in die verschiedenen Module?

00:07:26: Und dadurch dass das Modell eben viel mehr Zeit und viel mehr Token aufgebracht hat, um das Ganze zu machen.

00:07:32: War die Architektur besser und du hattest wirklich einen richtigen Sprung damit?

00:07:37: Wie sehr vertraue ich den?

00:07:41: Ist eine gute Frage!

00:07:43: Ich würde sagen es kommt immer darauf an wo bewege ich mich in der Codebase.

00:07:47: Meistens ist tatsächlich so wenn ich selber am Amp arbeite und den Coding Agent Aufgabe gibt... Wenn's in dem Teil von der Code Base ist wo ich mich sehr gut auskenne Kann ich Ihnen direkt sagen, hey wo wird es integriert?

00:08:01: Was sind die richtigen Punkte?

00:08:02: was das Design dass sich haben will.

00:08:04: Was ist das Interface und gibt es meistens direkt im Modell und dann kann ich einmal drauf schauen um es passt.

00:08:10: wenn's in anderen Teilen ist muss ich da ein bisschen mehr lesen.

00:08:14: Und dann ist so die Frage Hey wie viel Zeit will Ich oder Muss ich damit verbringen?

00:08:19: In manchen Sachen ist es nicht kritisch, zum Beispiel.

00:08:22: Es ist ein Admin-Dashboard, das nur intern benutzt wird.

00:08:26: Das muss nicht das Beste Design oder die höchste Softwarequalität haben oder die Höchste Performance.

00:08:30: Andere Sachen wenn's Userfacing ist, muss ich genauer drauf schauen und dann muss ich eben bisschen mehr in Code Review reinsteigen.

00:08:38: aber der Mensch muss entscheiden wie wir Review machen und deswegen finde auch diese Coding Agent kein kompletter Satz für einen Entwickler.

00:08:46: Es macht dich nur viel effizienter.

00:08:48: Und diese Taste, also was ist eine gute Architektur?

00:08:52: Was ist ein guter Design für mein Produkt, für meine Software die entwickelt.

00:08:56: Ist das endlich bei dir als Nutzer und eben auch dieser Entscheidungen.

00:09:00: Hey will ich es jetzt aufwenden?

00:09:03: Ja ist in meiner Erfahrung auch so... Ich merke auch Dinge, wo ich selber sehr viel darüber nachgedacht habe.

00:09:10: Wo ich selbst weiß was sich für eine Architektur haben will.

00:09:13: da kann man dann sehr schnell auch nachsteuern wenn man sieht okay es geht vielleicht nicht in die richtige Richtung oder halt am Anfang direkt das spezifizieren.

00:09:21: aber es kommen natürlich jetzt immer mehr Leute auch wie ich auf den Geschmack Software zu entwickeln, die eigentlich nicht klassische Software-Entwickler sind.

00:09:29: Wie siehst du das denn?

00:09:30: Also AMP richtet sich, glaube ich stand heute noch eher wirklich an die Profis und die erfahrenen Softwareentwickler.

00:09:38: oder würdest du auch sagen dass sie ja auch schon in Richtung erschließen neuer Nutzergruppen geht, die Vibecoder auch mal mit AMP experimentieren können?

00:09:49: Also wir haben auch Vibecoder, ich mag den Begriff nicht wirklich.

00:09:53: Ja

00:09:54: der Begriff ist scheiße aber irgendwie hängt er fest.

00:10:00: Ich habe auch nicht den klassischen Softwareentwicklers hintergenommen.

00:10:04: Ich hab was studiert das schimpft sich Turmbewell, ist eine Kombination aus BBL und was auch immer an technischen Nebenfachen du haben willst.

00:10:15: bei mir war es hauptsächlich Computer Engineering also sehr, sehr viel Reinforcement Learning und der EI gemacht.

00:10:21: Die ... Deswegen Software-Entwicklung ist bei mir auch nur anzehniert.

00:10:25: Und ich glaube ein großer Teil von der Software Engineering oder von Software Engineers oder der allgemeinen Branche sind nicht trainierte Computer Scientists, die das an der Uni studiert haben.

00:10:37: Das sind sehr viele, die es nicht haben sondern die eben durch Erfahrung das meiste gelernt haben.

00:10:43: Und... Ich glaub, das ist auch der schlagende Punkt in Software Entwicklung.

00:10:48: der Großteil an was man lernt ist durch Erfahrung.

00:10:54: Also wie viel benutze ich heutzutage noch ein Wissen, das mir in der Uni beigebracht wurde?

00:11:01: Nicht soviel!

00:11:03: Klar es ist nützlich zu wissen... Aber

00:11:05: die Frage wäre, wie würdest du klarkommen wenn du dieses Fundament nicht hättest ne?

00:11:08: Wenn du dieses Learning to learn nicht durchlaufen wärst?

00:11:13: Ja Und auch zu dieser, diese fundamentalen.

00:11:16: Wie funktioniert das CPU?

00:11:17: Was ist Memory?

00:11:18: Was is'n Cache?

00:11:19: L one L two or three?

00:11:21: Alles sehr, sehr nützlich aber letztendlich... ...sehr weit weg von dem was ich in Software entwickeln mache und... ...was du eben jetzt heutzutage auch hast, du kannst viel schneller lernen.

00:11:36: also als ich angefangen habe zu programmieren.

00:11:38: es war sehr schwer weil letztendig um einen komplettes Projekt zu bauen, muss man sehr, sehr verschiedene Programmiersprachen können.

00:11:49: Normalerweise brauchst du immer irgendwas für Frontend, irgendwas fürs Backend.

00:11:53: Ich habe viel Embedded gemacht.

00:11:56: dann direkt der Startpunkt ist direkt mal in C alles.

00:12:00: jedes Mal wenn du ein Problem reingelaufen bist sagst du da erstmal ein paar Stunden und musst es sicher durchfuchsen, muss es seg overflow die Dokumentation lesen und bist meistens dann trotzdem nicht weitergekommen.

00:12:12: Deswegen finde ich, heutzutage haben die Leute viel bessere Möglichkeiten programmieren zu lernen.

00:12:19: Und vor allem auch so komplette Projekte abzuarbeiten alleine und so projektbasiert das Lernen zu machen.

00:12:26: Und ich glaube, dass ist der große Vorteil auf dieser Technologie.

00:12:29: was halt dieses Vibe Coding auch viel mehr ermöglicht.

00:12:33: Dass du halt Vibecoding kannst aber auch relativ zügig vom VibeCoding zur richtigen Entwicklung gehen kannst weil du einfach schneller lernst wenn du versuchst zu lernen.

00:12:44: Und ich glaube das geht oft verloren, dass die Leute Vibecoding einfach nur und... Lernen aber nichts draus aus ihren Fehlern oder aus Sachen, die sie gebaut haben!

00:12:53: Und ich glaub' das muss halt noch so ein Aspekt sein und ich find's auch diese... Das geht so in die Richtung so Technical Dapt bei VibeCoding.

00:13:00: Man baut sehr viel Technical Dap auf weil die.. gerade anfängst, das Modell einfach nicht dirigieren kannst.

00:13:06: Hey wie soll es gebaut werden?

00:13:08: Wie halte ich eine Codebase relativ sauber und modular und habe nicht Dependencies oder Top-of-Dependancies?

00:13:16: Und... Ich glaube um das zu schaffen muss halt wirklich darauf fokussiert sein.

00:13:20: hey ich nimm was daraus weg von den was ich gerade mache oder von einem Problem die sich gelöst hat.

00:13:26: Was war davor falsch?

00:13:27: Was mach jetzt richtig?

00:13:28: Was mache ich besser?

00:13:30: Wie kann ich das in der Zukunft anwenden und auch hinterfragen, um wirklich tiefer zu gehen.

00:13:34: Hey warum war das falsch?

00:13:35: Warum war es falsch?

00:13:37: Und ich glaube wenn man das macht kann man viel schneller in diese Softwareentwicklung reingreifen und viel schneller Erfahrung sammeln was man früher nicht hatte weil früher hattest du erst mal eine lange Trainingsphase im Unternehmen bevor du überhaupt was richtiges bauen durfte oder beitragen durftest.

00:13:53: Ja, also das deckt sich auch mit meiner Erfahrung tatsächlich.

00:13:57: Also ich sage auch immer die letzten drei Jahre habe ich mehr gelernt gefühlt als jemals zuvor.

00:14:03: aber es ist halt auch man muss es wollen.

00:14:05: Es ist natürlich sehr schnell dass man in den Modus kommt.

00:14:08: okay ich hab den magischen Knopf auf den drückig und dann kriege ich mein Ergebnis was ich haben will Und hinterfrage gar nicht, was da gerade passiert ist und kenne ich aber auch selber.

00:14:16: Also man verfällt da sehr schnell rein und deshalb gibt es ja auch einige die sagen Ja schön und gut jetzt kann man theoretisch schneller lernen.

00:14:23: Aber das eigentliche Lernen hat ja früher erfolgt durch so etwas wie Reibung Die entstanden ist dass man wirklich, wie du gesagt hast.

00:14:32: Man musste sich durchkämpfen, durch gewisse harte Sachen Stack Overflow oder sonst was ausprobieren.

00:14:38: Ich bin da selber sehr zwiegespalten weil ich persönlich schon glaube das man jetzt mit KI und LLMs extrem schnell lernen kann wenn man es richtig macht.

00:14:45: aber die Frage ist natürlich ob das in der Breite auch wirklich dann so ankommt?

00:14:50: Oder ob wir nicht ein Verlust von Fähigkeiten haben und das dann erst später merken werden.

00:14:57: Ja also ich glaub dieses Ich entlerne etwas, ist so ein Punkt der bei mir immer im Hinterkopf mitschirmt.

00:15:06: Man kommt in diesen Reflex rein.

00:15:08: ich denke nicht mal über den Problem nach bevor ich das einen LLM gebe sondern mach einfach Copy und Paste nimm den Userbug Report schmeiß es in den Coding Agent Rhein und meistens produziert dann eine Lösung und ich muss selber nicht nachdenken Und passt für sehr viele Anfragen, aber ist halt auf Dauer wenn ich das permanent mache.

00:15:34: Wahrscheinlich kontraproduktiv für dich selber weil du irgendwann die kompletten Fähigkeiten wie du eigentlich aufgebaut hast verlernst.

00:15:42: Aber der Software-Entwicklung ist syntax zum Beispiel von einer gewissen Programmiersprache wirklich des entscheidendste was zu lernen solltest.

00:15:51: Ist bestimmt hilfreich, aber ich konnte es schon immer nachschauen mit einem guten LSP Und jetzt machen die Modelle einfach viel mehr.

00:15:59: Also das ist ein besseres Tool für den Job.

00:16:03: Ich sollte aber hinterfragen, hey!

00:16:04: Ist die Arbeit, die gemacht wird wirklich notwendig?

00:16:07: Was passiert da wirklich im Hintergrund, dass ich das verstehe?

00:16:10: Wie wird es ausgeführt?

00:16:11: Ist es die richtigen Reihenvögel oder an der richtigen Stelle?

00:16:13: muss die Arbeit überhaupt gemacht werden?

00:16:15: So und ich glaube, es schiebt einfach mehr von der Arbeit auf einem höheres Level, auf einen konzeptionellen Level was tendenziell schon immer die schwierigere Arbeit war wo man sich einfach ein bisschen mehr hinsetzen muss und sich stark konzentrieren muss und verschiedene Designmöglichkeiten abwägen.

00:16:36: Und das ist tatsächlich das, wo ich am meisten Angst habe dadurch dass es immer diesen LLM gibt, dass es so ein bisschen wie Instagram Reels ist.

00:16:46: Man trainiert seinen kurzen Attention Span und verbringt eben keine Zeit damit mal sich hin zu hocken, mit Blogger und Papier oder auf dem Whiteboard so verschiedene Designmöglichkeiten abzuwägen.

00:17:00: Weil es eben so einfach und so schnell ist eine Lösung zu produzieren.

00:17:04: Und früher weil ich das per Hand coden musste und dieses Code sehr lang gedauert hab habe ich meistens mir erst überlegt hey wie und was mache ich?

00:17:12: Und dann implementiere ich's.

00:17:15: Jetzt weißte schnelles was zu produzieren gehe ich meistens direkt in die Umsetzung und macht mir weniger Gedanken drüber.

00:17:22: Und

00:17:25: ist wahrscheinlich etwas, was wir jetzt auch lernen müssten.

00:17:28: also ich meine den goldenen Weg kennt noch keiner würde ich behaupten.

00:17:32: also die technologie entwickelt sich so schnell weiter dass wir alle mehr oder weniger probieren.

00:17:37: Was gut funktioniert, was nicht gut funktioniert?

00:17:39: Es gibt natürlich manche die sind natürlich weiter als andere.

00:17:42: aber ich glaube viele Learnings merkt man jetzt auch so.

00:17:46: Die machen alle Leute so durch.

00:17:47: und das was du angesprochen hast dass man vielleicht sich doch dann trotz der Fähigkeit den LLM zu nutzen auch mal hinsetzen von Hand oder zu Fuß überlegt bevor man dann das LLm anschmeißt ist zumindest etwas was ich versuche bei bestimmten Tätigkeiten bedeuten zunehmend doch schon zu machen, wenn ich jetzt irgendwie einen blog Eintrag schreibe oder so dass ich sage ne.

00:18:09: Ich schreib es einfach selber auch wenn das mühselig ist und aufwendiger.

00:18:13: aber am Ende geht's mir ja darum dass ich quasi meine Ideen rüber bringe und aufschreibe Und ich kann mir vorstellen dass es wird so bei eigentlich allen Berufsgruppen sein Dass wir feststellen werden.

00:18:24: wo sollten wir doch noch wirklich zu Fuß auch mal vielleicht ab und zu, nicht immer aber den Weg gehen.

00:18:30: Und wo können wir uns wirklich dann auf die Systeme verlassen?

00:18:35: Ja und ich hocke gerade zum Beispiel an dem Problem mit wie haben wir den Fokus von unserer CLI-Applikation?

00:18:45: also wo wird der gerade gesetzt und wie wird er weitergegeben?

00:18:50: von Komponent to component?

00:18:55: Das erste was ich mache erst mal hin und schaue mir verschiedene Sachen an, wie die das Hand haben.

00:18:58: Ich habe mir ein Browser angeschaut, ich hab mir Flutter angeschaudt, ich habe mir Radix UI Primitives angeschauert.

00:19:05: Wie benutzen die Fokus?

00:19:08: oder wie wird es weitergegeben?

00:19:09: Was sind so die verschiedenen Aktionen... ...die passieren können?

00:19:14: also Fokus wird weiter gegeben der Fokus geht komplett verloren und der Komponent wird unmounted from Dom.

00:19:23: Was ist die Datenstruktur dahinter?

00:19:25: und einfach nur weil es eine wichtige Komponente ist.

00:19:27: Und bei mir ist, ehrlich gesagt ich verbringe jetzt lieber mehr Zeit und ließe mich da gut ein, versuche dann verschiedene Designs und schießt dann wirklich dadurch dass die Implementierung so schnell ist.

00:19:38: kann ich jetzt wirklich sagen ich höre mich hin implementiere drei vier verschiedene Möglichkeiten und suche mir dann die Beste aus die mir am meisten gefällt das sich eben später mich nicht mehr hinorknen muss, sondern ich baue einfach eine Abstraktion.

00:19:51: Ich weiß sie funktionieren und bin dann fertig mit diesen

00:19:53: Dingen.".

00:19:53: Und ich glaube das ist so ein Punkt wo ich immer mehr zugekommen bin.

00:19:57: Ich entscheide mich wenn es wirklich wichtige Sachen sind... ...ich hock mich hin versuchen in sauberes Design zu kommen implementiere mehrere.. ..und entscheid mich dann für eins einfach nur dass sich nicht dann in der Zukunft wieder zurückkommen muss.... ...und zwanzig verschiedene Bug Reports habe die ich alle in dieses LLM rein schmeiß... neuen Code hinzufügen wie dieses Homer Simpson Auto auf der gleichen Logik, einfach nur bei dieser ersten Logik nicht sauber aufgebaut worden.

00:20:26: Ja, das finde ich tatsächlich ein sehr gutes Beispiel.

00:20:29: Weil das ist ja etwas was man früher einfach gar nicht gemacht hätte oder hätte machen können weil es einfach viel zu aufwendig gewesen wäre zu sagen Ich implementiere jetzt fünf verschiedene Ansätze.

00:20:38: Das haben sich vielleicht wenn überhaupt nur große Unternehmen erlauben können für Heistakes Projekte.

00:20:44: Und jetzt kann man sich angewöhnen und kann man machen und hat dadurch dann direkt die Möglichkeit zu sagen okay ich nehme dann wirklich das was am ergonomischsten mir vorkommt.

00:20:52: was am besten passt finde ich cool, weil es ist eine neue Art dann auch wieder zu arbeiten.

00:20:57: Und da sieht man wie dieser technologische Wandel einfach ganz neue Arbeitsweisen hervorbringt.

00:21:06: Ja und auch... Ich glaube das ist mit der beste Schnittpunkt um zu lernen wenn man versucht zu formulieren warum die eine Lösung komparativ besser ist als die andere und wirklich jede Lösung unabhängig mal zu bewerten, weil dadurch lernt man dann auch besser diese konzeptionelle oder software Design Ebene in dem man mehrere verschiedene Lösungswege abwägt.

00:21:33: Und formuliert warum sie besser ist als eine andere oder warum Sie für das Problem dass sich lösen will besser geeignet ist?

00:21:42: Ja es auf jeden Fall was ich mir auch mitnehmen werde.

00:21:45: Ich habe das bisher schon auch paar mal ausprobiert, aber ich würde sagen noch zu selten.

00:21:51: Weil die Möglichkeiten hat man ja jetzt in kürzester Zeit den Code zu erzeugen wenn man das Konzept einmal hat und ich finde das ist tatsächlich ein sehr guter Ansatz.

00:22:03: Ihr seid bei AMP, wenn man jetzt so euren Werdegang verfolgt anders als viele andere würde ich sagen seid ihr ja sehr rigoros mit den Features dass ihr sagt ja hattet Features oder das Handoff erwähnt.

00:22:14: Ich bin mir nicht sicher ob es Handoff noch drin ist bei euch rausgeschmissen habt, aber es gab viele andere Features wie To-Do Listen die dann quasi das LLM parallel geführt hat wo ihr gesagt habt dass schmeißen wir wieder raus.

00:22:26: Das brauchen die neuen Modelle einfach nicht mehr.

00:22:30: Wie geht dir da vor?

00:22:32: Wie stellt ihr fest was ihr braucht und was ihr nicht braucht und das ihr wirklich dann entscheidet okay lasst uns das Feature wieder rausnehmen.

00:22:39: Also ein großer Punkt ist auf der Modellseite.

00:22:43: Die Modelle werden aktuell immer besser.

00:22:47: Du hast alle paar Monate, hast du immer mal wieder so einen Step Change.

00:22:51: Dass halt wirklich den spürbaren Unterschied merkst wie viel besser das Modell ist und dadurch verschwinden schonmal ein Haufen Features also die To-Do Listen.

00:23:00: zum Beispiel ist eins davon am Anfang bei Sonnet drei Punkt fünf vor allem mit dieser erstes erste Modell womit so Coding Agents die autonom Aufgaben lösen, möglich geworden sind.

00:23:14: Hat man das gebraucht?

00:23:15: Einfach nur dass es Modell wie sonst Scratchpad hat wo's einfach nur Haken setzen kann nacheinander.

00:23:20: hey!

00:23:21: Das ist meine Aufgabe und das habe ich jetzt schon fertig gemacht.

00:23:23: und das ist der nächste Punkt weil die Modelle ansonsten auf den Faden verloren haben und einfach nicht mehr die richtigen Sachen oder die komplette Aufgabe nicht mehr bis zum Ende durchgeführt haben.

00:23:40: Feature inhalieren, sind mir da rigoros.

00:23:42: Also wir reißen es einfach raus und Handoff wird da das nächste sein.

00:23:46: also hand off wird nicht mehr lang überleben.

00:23:49: Weil die Modelle inzwischen einfach gut genug sind dass wenn ich ihn einfach frag hey fasse diesen diese Konversation zusammen sie produzieren einen sehr guten Output.

00:23:59: damit brauche ich dieses extra logik die Handoff implementiert brauche LLM-Calls macht, um möglichst viel Kontext beizubehalten zu der neuen Konversation.

00:24:14: Und dann ist der zweite Punkt es benutzen wir selber die Feature.

00:24:19: also Es gibt wahrscheinlich kein Team das die Coding Agents mehr benutzt oder AMP mehr benutzt als wir selber und Das ist immer auch so Entscheidungsgebend benutzen wie unsere eigenen Features wirklich?

00:24:32: Oder sind sie eigentlich unnötig?

00:24:34: und da jetzt zum Beispiel die, wie es Code Extension waren ein großes Ding was einfach sehr wenige von uns aus dem Team benutzt haben weil die Terminal Application einfach der bessere Weg war um diese Coding Agents zu benutzen und da ich glaube das merkt man auch an vielen anderen Duckten, dass sie da eben nicht so rigoros sind.

00:25:05: Weil man eben die Kunden nicht abschrecken will aber ich glaube das wird... Das ist oft ein Nachteil vor allem wenn man mit LLM das Produkt selber baut weil es sehr einfach Features hinzuzufügen und es wird meistens ignoriert Features wieder weg zu nehmen.

00:25:28: Und wenn irgendwas nicht mehr notwendig ist, ich brauche es nicht mehr würde ich immer eher dazu tendieren hey ich subtrahier vom Produkt.

00:25:36: Dadurch wird es einfacher neue Features wieder hinzuzufügen einfach nur weil die allgemeine die Surface Area von Code ist geringer Es ist einfach zu maintainen es ist einfacher als team in Übersicht zu behalten wodurch die Code Qualität finanziell besser ist Weil ich kann besser beurteilen was das LLM macht und Ich glaube, es sind so viele verschiedene Punkte die da mit reingehen und ich denke aktuell ist das ein bisschen eine Leinstellungsmerkmal weil vor allem die ganzen Coding Agent Companies.

00:26:06: Sie sind sehr sehr LLM Driven.

00:26:10: also viel von ihren Code hundert Prozent von Ihren Code oder was soll man sehen zwischen sich hin schreiben?

00:26:15: Man wird ja sehr stolz drauf!

00:26:17: Wie hat produziert von LLMs.

00:26:19: aber vielen sieht man das halt auch dass wirklich diese Meme von der Homer Simpson Cara ist Overengineered, hundert verschiedene Features nie wird irgendwas entfernt.

00:26:29: Es gibt fünf verschiedene Wege das Gleiche zu machen.

00:26:31: es ist unklar für den Kunden wie soll er seinen eigenen Prozess aufbauen und optimieren?

00:26:39: Und da finde ich du hast inzwischen die Möglichkeiten einfach viel mehr zu bauen aber dadurch solltest du auch viel mehr rausreißen.

00:26:49: Das nächste Feature, das nächste Interface ist schnell da und wenn irgendwas nicht mehr das Richtige ist für das Produkt oder fürs Nutzerverhalten.

00:26:58: D.h.

00:26:58: Alleinstellungsmerkmal ihr seid sehr bewusst was die Features angeht, schmeißt Features gerne auch mal wieder raus damit man alles sehr überschaubar hält für euch einerseits in der Entwicklung aber auch letztendlich für eure Nutzer, eure Kunden die dann nicht, sage ich mal, fünftausend verschiedene Ansätze haben.

00:27:17: Wie man jetzt einen Prompt reinhauen kann?

00:27:20: Ob man da ein Skill benutzt oder ob man dann so eine Shortcut benutzt und wie auch immer das dann genannt wird... Was würdest du denn sagen sind sonst so Alleinstellungsmerkmale von AMP?

00:27:30: Ich glaube, eine Sache, die ich noch im Kopf habe ist ihr gebt quasi das Modell vor normalerweise was der User benutzt.

00:27:38: also hast nicht ne lange Liste an Modellen, die man selber auswählen kann sondern ihr kuratiert sozusagen die Modelle im Hintergrund, oder?

00:27:47: Ja also für die Leute die das nicht kennen ist oder noch nicht benutzt haben.

00:27:53: Cursor GitHub Co-Pilot haben zum Beispiel eine Model Picker und auch Klein Augment Code.

00:27:59: Du kannst ja quasi selber aussuchen hey welches Modell will ich jetzt benutzen?

00:28:05: Und gibt es bei uns nicht Die?

00:28:08: wir fokussieren uns darauf immer des aktuell.

00:28:12: Das aktuelle beste Modell für Coding ist der Default und es wird benutzt.

00:28:17: Und du hast nicht wirklich einen Weg aus der Rom, das ändert sich gerade ein bisschen.

00:28:22: also wir haben jetzt Smart & Deep was schlechte Labors sind.

00:28:27: als Ende ist... Wir machen gerade den Renaming.

00:28:32: Smart ist eher so dieses Interaktive.

00:28:35: ich hab wegen dem Formmodell.

00:28:36: Ich bin aktiv dabei, gibt Feedback und versuch das Modell in die richtige Richtung zu leiten.

00:28:41: Dafür sind zum Beispiel die Anthropic Modelle sehr gut.

00:28:45: In Deep ist für uns eher so dieses es läuft A-Sync, es läuft im Hintergrund.

00:28:49: ich gebe Ihnen am Anfang eine Aufgabe definiere es besser runter und schicke es einfach los.

00:28:53: und ich weiß hey das läuft jetzt vielleicht eine halbe Stunde als produziert guten Code und an einer halben Stunde gehe ich hin und schaue mir an was das Modellen gemacht hat.

00:29:00: Das sind diese zwei verschiedenen Modes die du aktuell bei uns picken kannst.

00:29:07: Darin kann sie aber jetzt nicht auswählen, hey welches Modell ich benutze.

00:29:11: Also das ist glaube ich auch nochmal ein so ein Ding was aber auch in die gleiche Richtung geht.

00:29:15: Hey wir reduzieren wie viele Optionen der Nutzer hat.

00:29:20: vor allem es sind durch die Menge an Modellen die es inzwischen gibt und die Menge auf verschiedenen Firmen.

00:29:27: Ich glaube den Nutzer haben Präferenzen Aber Sie wissen oft selber nicht Was genau sollen sie jetzt wählen?

00:29:34: also viele nutzer mögen es einfach Ihr nehmt das beste wir vertrauen euch und ihr macht es.

00:29:38: Und das zweite ist, wir haben halt auch einfach... Wir können wählen!

00:29:42: Wir können Open AI-Modelle nehmen, wir können Anthropic-Moderle nehmen, ...wir können K-Akturen nicht wirklich Google-Modelle nehmen.

00:29:50: Hattet

00:29:50: jeder Zeit lang eine Gemini als Default?

00:29:51: Hat mir ein bisschen ja.

00:29:53: Ich glaube Thorsten hat bereut es immer noch.

00:29:59: Ja gut aber ist da ja auch nur Einsichten.

00:30:04: Dadurch können wir wirklich auch schauen, hey für welche Aufgaben sind die Modelle am besten geeignet und zum Beispiel auch CodeReview?

00:30:12: haben wir eine gewisse Kombination an verschiedenen Modellen.

00:30:16: Für andere also Subagents ist es endlich der CodingAgent kann sagen Hey ich brauche jetzt Input von den anderen Agenten.

00:30:25: wie sollte das sein?

00:30:27: Und bei uns zum Beispiel das Oracle dafür können Ein sehr, sehr spezialisiertes Modell für Wellen.

00:30:33: Das da einfach sehr gut geeignet ist.

00:30:35: Für Codesuche haben wir einen eigenen Sub-Agent der eben wieder auf einem anderen Modell basiert und so können wir uns ein bisschen auswählen was das jetzt am besten geeignete Tier für?

00:30:46: Und es wie so ein Omakase-Menü.

00:30:48: also wir suchen uns aus was gemacht wird was gut zusammen passt und geben das letztendlich den Nutzer.

00:30:53: als Tools

00:30:55: hat natürlich für euch den großen Vorteil, es ist einfacher zu debaggen.

00:30:58: wenn jetzt irgendwelche Kunden sagen das und dass funktioniert nicht.

00:31:01: Ihr könnt es quasi direkt nachstellen.

00:31:02: ihr wisst welche Modelle dahinter hängen.

00:31:05: ich merke das selber.

00:31:06: Ich baue halt auch selber meine eigene Lösungen auch teilweise für die Kollegen.

00:31:10: Und wenn du da halt einfach unterschiedliche Modelle schon hast und dann nicht weißt welches Modell wurde da jetzt genutzt Das ist dann echt Teilweise schon harig das dann nachzuvollziehen.

00:31:21: von daher kann ich gut Verstehen, ich glaube viele Nutzer wollen einfach auch gute Ergebnisse haben.

00:31:28: Den ist vielleicht... Also klar es gibt sagen wir Fanlager wie du sagst.

00:31:32: Viele mögen die Cloudmodelle von Anthropic für den Charakter also für den Personality der Modelle sozusagen.

00:31:41: andere haben jetzt seit Monaten festgestellt okay die Codex-Modelle produzieren einfach bessere Ergebnisse aber letzten Endes glaube ich das ist zumindest so auch meine Hypothese Am Ende wird es vielleicht darauf hinauslaufen, dass das Modell selber relativ egal ist.

00:31:57: Wenn da die Unterschiede klein sind, am Ende will man halt diese Ergebnisse haben und von daher finde ich euren Ansatz durchaus spannend und gerechtfertigt.

00:32:07: aber wie positioniert ihr euch denn gegenüber jetzt den Laboren, die ja selber sehr ähnliche Produkte im Portfolio haben?

00:32:16: Es ist ein, ich glaube wir haben einen viel stärkeren Enterprise-Fokus kommt aktuell immer mehr bei Anthropic and Open Air auch rein, dass sie ihre Coding Agents mehr für Enterprises positionieren.

00:32:31: Aber es fehlen immer noch einige Features die wir von Anfang an eigentlich an geboten haben was mich auch ein bisschen wundert.

00:32:36: ehrlich gesagt jetzt zum Beispiel die VM Threadsharing.

00:32:39: heißt das endlich alle Konversationen die der Nutzer mit den Agenten hat sind in einer Datenbank abgelegt und sind zugreifbar von zum Beispiel einen kompletten Team Und die können sich das anschauen, was viele Sachen einfach extrem einfach macht um Arbeit auf der Arbeit von anderen aufzubauen.

00:32:59: Also was ich oft mache Thorsten hat heute etwas hinzugefügt mit Support Sharing also wie wir eine Konversation quasi mit uns als Team geteilt.

00:33:09: wenn er nur sagt hey da war ein Problem und ich konnte einfach nur den gleiche Konversations von ihnen nehmen Konnte die ID nehmen und konnte den Agent sagen, hey wir brauchen was Ähnliches.

00:33:19: Gleiche Logik um die Visibility also die Sichtbarkeit von den Threats einzustellen.

00:33:24: Also ob sie jetzt zum Beispiel für den Workspace sichtbar ist mit meinem Team oder nur für mich privat oder es das Publik quasi jeder kann darauf zugreifen.

00:33:33: Und dadurch kann ich einfach direkt auf Torsten seine Arbeit und Torsten seinen Entscheidungen aufbauen Und der Agent kann das einfach nehmen und ich habe einfach weniger Arbeit, weil ich weniger in den Prompt reinschreiben muss.

00:33:46: Ist oft auch ein bisschen interessant dass es oft so zum Lehren benutzt wird also Mitchell Hashimoto macht das auf, dass er wirklich zu einen Commit den bei uns heißt ist Threat die Konversation einfach anhängt, dass Leute sich das anschauen können und durchlesen können.

00:34:03: hey warum hat er das gemacht?

00:34:06: Wir haben die Prompts geschrieben Und dann ein bisschen was machen können.

00:34:10: Er postet es auch oft auf Twitter und einfach den Leuten zu sagen, hey warum habe ich das gemacht?

00:34:14: Wie funktioniert das?

00:34:15: Was sind so die Trade-offs oder meine Entscheidungen, die hier reingeflossen sind?

00:34:19: Das ist so ein großer Aspekt!

00:34:20: Einfach viel mehr Teamfokus.

00:34:22: wie arbeiten als Entwickler fast immer in dem Team zusammen... ...und wir wollen das möglichst einfach machen dass vor allem so auch die Übergabe ermöglichte einfach ist.

00:34:30: Also nachdem jetzt immer mehr Leute programmieren, Product Manager Designer.. ..können sie halt auch einfach schon mal diesen Code produzieren.

00:34:37: Und für mich ist es oft einfacher, wenn der Designer irgendwas produziert.

00:34:41: Ich habe nicht nur eine Branch auf die er hoch gepusht hat sondern ich hab auch den Thread und kann mir den Thred und seinen Entscheidungen oder Wasser haben will letztendlich durchlesen und das übernehmen.

00:34:51: Und oft ist dann wirklich so wie ich übernimm das... ...und übersetzt einfach nur in technische Sprache, wie das umgesetzt werden soll.. direkt generieren, so wie es das Designer haben will und habe quasi diesen Kontext von mir.

00:35:05: Von der technischen Seite aber auch die Design Seite, wie sie ausstehen sollte.

00:35:09: Und das ist ein großer Aspekt vor allem was bei uns der Fokus ist.

00:35:12: hey erstes ein Team Sport.

00:35:13: wir arbeiten hier zusammen... ...und wir wollen das letztendlich auch zusammen machen

00:35:18: Ja, halte ich tatsächlich für ein super gutes Feature.

00:35:21: Ich habe für mich und meine Kollegen was Ähnliches gebaut also gar nicht mit dem Fokus Coding sondern wir haben quasi eine Plattform wo man dann verschiedene agentische Workflows sozusagen anstoßen kann.

00:35:31: Chit basiert Also fühlt sich nicht anders an als jetzt Chatchi Bittu und Co.

00:35:35: nur dass im Hintergrund wirklich Coding Agenten laufen weil die einfach... mehr machen können.

00:35:40: Und ich habe tatsächlich auch so shared Workspaces, wo man quasi gleichzeitig sehen kann was machen die anderen da?

00:35:46: Man kann gleichzeitig in die Konversationen einsteigen der das LLM kriegt einen quasi mit jedem Prompt noch genannt.

00:35:51: okay dass jetzt User XY der das gerade schreibt und ich halte das tatsächlich für super wertvoll nämlich zu lernen wie gehen andere mit diesem System um?

00:35:59: dadurch dass man ehrlich ist die Technologie ist noch so neu viele Leute Also jeder geht damit ein bisschen anders um und am Ende kommen immer alle und sagen, ja wie lerne ich jetzt zu prompten oder wie mache ich das besser?

00:36:10: Und mir fällt es oftmals schwer.

00:36:11: Ich sage einfach ausprobieren und learning by doing Aber sich anzuschauen wie andere damit umgehen dass ist glaube ich echt auch super wertvoll.

00:36:19: und jetzt im codingbereich kann ich mir vorstellen wird Das auch sicherlich zum standard werden dass man sagt Man muss diese conversation halt auch irgendwo hinterlegen damit wir hinterher die transparent haben nachvollziehen können okay Wie ist das jetzt entstanden?

00:36:30: Ja und ich glaub vor allem dieses Was auch ein punkt ist so dieses proof of work.

00:36:36: Also jetzt im Mitchell Hashimoto klar, wenn der irgendwas macht ich weiß das hat technisch Hand und Fuß aber inzwischen haben wir halt einfach so viele block post oder reddit post die generiert werden die quasi sagen hey oder die irgendein guide geben wie machst du irgendwas?

00:36:55: Und fast alle davon sind LLM generiert.

00:36:58: und also was vertraue ich jetzt als ... in einer guten Basis und einen guten Food am Ende, wie ich mit den Modellen handhaben sollte.

00:37:08: Und ich finde da ist halt so eine Konversation wenn ich sehe wieder Mensch das wirklich benutzt nützlicher... weil jetzt endlich seh' ich hey es ist ein bisschen Proof of Work du hast wirklich damit was gemacht das hat's vielleicht sogar, es wurde vielleicht sogar gepusht.

00:37:21: Am ende ist es reingekommen.

00:37:23: also es hat einen guten Output produziert am Ende und ich habe ein bisschen mehr Vertrauen dass es ne gute Herangehensweise ist, als wenn ich jetzt den zwanzigsten Post lese wie ich mein Prompt richtig strukturier auf Reddit.

00:37:39: Die alle einen LLM gefragt haben hey schreib mir einen Blog Pause wie ich ein Prompt wirklich strukturiere die sie wahrscheinlich am Ende auch alle auf dem gleichen einen Artikel beziehen der auch von einem LLm geschrieben wurde.

00:37:52: Ja klar also da das halte ich für tatsächlich sehr ja Interessantes Problem, was wir jetzt natürlich schon sehen und in Zukunft noch mehr sehen werden nämlich immer mehr KI-generierte Inhalte.

00:38:04: Und dann auch nachzuvollziehen okay ist nur weil es KI generiert.

00:38:07: das ist ja nicht per se schlecht sondern letztendlich was man aber will ist dass es durchdacht ist dass sich jemand Gedanken darüber gemacht hat dass vielleicht auch die eigene Meinung wirklich drin steckt und nicht nur irgendwas sag ich mal wiedergekautes was das LLM so ausgespuckt hat.

00:38:23: Und von daher glaube ich außerhalb von Coding wird dieses Thema, dass man halt wirklich nochmal die Traces hat oder die Chat History.

00:38:31: Um das nachvollziehen zu können wird sicherlich in vielen Bereichen wahrscheinlich relevant werden.

00:38:37: Oder

00:38:37: irgendeine Art von... Ich glaub in Git hab' oder bei Open Source Projekten sieht man es jetzt schon ein bisschen, dass es kommt mit irgendeinen Reputationssystem wo es daran liegt.

00:38:49: einen anderen Maintainer musste ich empfehlen.

00:38:53: Oder du bist auf einer Weidlist, nicht auf einer Blacklist.

00:39:00: Was ich letztendlich mal sehen will ist irgendein Proof of Work.

00:39:03: also man hat wirklich schon Arbeit geleistet Ich habe Subjektexpertise, ich hab wirklich Research gemacht und ich sehe das auch dass du dich mit dem Thema intensiver auseinandergesetzt hast die mehrere Sachen dazu angeschaut oder durchgelesen hast ein paar Sachen implementiert und ausprobiert hast Und ich glaube, das wird halt auch immer schwieriger.

00:39:23: Wie mache ich das?

00:39:24: Und wird in der Zukunft zum Beispiel ein schlecht geschiebener Blog-Posten besser das Merkmal sein als richtig gutgeschrieben, weil die LLMs so gut sind im Schreiben, dass ich dann denke, hey!

00:39:35: Das hat einen Mensch geschrieben, der ist zwar schlechtem Schreiben aber er hat sich halt mit dem Thema wenigstens auseinandergesetzt...

00:39:40: Dann werden sich meine Blogpost vielleicht tatsächlich absetzen.

00:39:43: Da ist auf jeden Fall immer noch viele Rechtschreibfehler und grammatikalische Fehler drin.

00:39:47: Weil ich einfach zu faul bin nochmal zurückzugehen zu bügeln.

00:39:53: Aber das ist spannend, weil das Gleiche wird es vielleicht dann auch geben bei der Bewerbung.

00:39:58: also es ist ja heutzutage schon so dass die Unternehmen wenn die eine offene Stellen haben du kannst hier gar nicht retten vor KI generierten Bewerbungen die dann alle irgendwie gleich aussehen und alle irgendwie behaupten keine Ahnung was man für Erfahrung hat.

00:40:13: ich glaube das Thema Reputation Und Empfehlung durch andere Personen wird wahrscheinlich in Zukunft wirklich wichtiger werden, um überhaupt dann durchzukommen.

00:40:24: In der Masse

00:40:26: oder eine Seitentür.

00:40:27: also das was ich habe da irgendwann mal im Blog post gelesen den ich eigentlich relativ gut fand.

00:40:32: die meisten Leute wenn ne Bewerbung ausgeschieben wird versuchen wir erstes direkt hey ich bewerb mich aber das ist letztendlich der einfache Weg.

00:40:41: Und was man immer machen kann ist, hey was für Probleme hat das Unternehmen gerade?

00:40:46: Das ein bisschen Bezug auf diese Stelle hat.

00:40:50: Und mir dann gehe ich auf die Website und schaue mit den verschiedenen Sachen an... ...und dann kann ich halt einfach relativ zügig heutzutage mit lovable, mit AMP, mit irgendeinem Coding Agent dafür eine Lösung produzieren.. ..und dann anstelle dass ich nur ne Bewerbung habe schicke ich das halt gleichzeitig auch mit Ein bisschen, hey ich habe mich damit auseinandergesetzt.

00:41:09: Das sind die verschiedenen Optionen.

00:41:11: das ist das Problem, dass ich gesehen hab, das sind Lösungswege.

00:41:14: letztendlich habe ich diesen Lösungsweg gewählt und schickt es mit oder schickt direkt an irgendein Arbeiter oder meinen zukünftigen Fortgesetzten?

00:41:24: Und damit sind sie halt direkt ein bisschen begeistert da oder sehen?

00:41:27: Hey!

00:41:27: Ich habe mir auch Gedanken gemacht, habe mich ein bisschen mit dem Thema auseinandersetzt und schick direkt etwas mit was eben zeigt Ich habe Lust auf dieses Thema und mich damit auch auszusetzen.

00:41:38: Es wird auf jeden Fall nicht einfacher, ne?

00:41:40: Also man muss sich da tatsächlich dann schon immer mehr Gedanken machen.

00:41:43: aber ja letztendlich ist das eine bittere Pille die wir schlucken müssen.

00:41:51: oder trotz oder gerade wegen KI werden solche Sachen wahrscheinlich nicht einfacher werden sondern aufwendiger.

00:42:02: Du hattest es schon gesagt also ihr setzt euch ab gegenüber Open AI und Co durch bestimmte Features, Enterprise, Focus.

00:42:13: Andere gehen ja den Weg wie Cursor beispielsweise, dass sie auch eigene Modelle Feintune zumindest also nicht komplett selber trainieren sondern dann auch mal gerne ein chinesisches Modell nehmen und Feintunen macht ihr das auch schon?

00:42:26: Habt ihr darüber nachgedacht?

00:42:27: ist das für euch Out of Scope?

00:42:28: du sagst ihr seit zwanzig Leute?

00:42:31: Also wir hatten unser Tabmodell zum Beispiel also für Autocomplete.

00:42:36: Also das ist ja nicht das was man sieht, wenn ihr zum Beispiel in VS Code seid dass die nächsten paar Wörter vorgeschlagen werden.

00:42:45: Da hatten wir unser eigenes Modell... Wir hatten auch mal ein eigenes Model für den Codebase Search Die ich sehe es Für vor allem unsere Teamgröße.

00:42:56: A seh ich's problematisch.

00:42:58: B Ich finde die Maintenance die man sich aufbürdet sobald mein Modell geniert ist das, was meistens unterschätzt wird und was immens ist.

00:43:10: Ein Modell zu trainieren der Input der vorne reingeht ist schon groß.

00:43:15: aber ich finde die Maintenance ist noch größer weil Ich muss es immer up to date halten Und ich muss es gegenüber von den Open AI und Antropic Modellen Die sich hauptsächlich darauf fokussieren und Tausende Mitarbeiter haben, die nicht anderes machen als Modell Training Muss ich up-to-date bleiben.

00:43:36: Und das ist, finde ich die Hauptproblematik.

00:43:37: Weil das Modell muss komparativ zu den Modellen von Open AI und Anthropik gleich aufbleiben.

00:43:45: Das kostet extrem viele Desserts und extrem viel Zeit oder extrem viel Fokus.

00:43:50: Ich glaube es ist für kleine Teams extrem schwer.

00:43:52: Ich bin wirklich gespannt wie Cursor das Managen wird und ob sie da wirklich ein paar bleiben können?

00:44:00: Du hast einfach nicht die gleichen Ressourcen.

00:44:01: Du hast nicht die gleiche Leute, die du anlockst als Coding Agent in einen reinen Research Lab und das dann eben einmal Modell zu trainieren dass richtig gut ist.

00:44:13: okay aber kannst du es dann konsistent auf den gleichen Punkt halten?

00:44:19: Und auch der gleichen Performance wie die großen Labs und ich?

00:44:23: also ich würde sagen für uns kaum möglich oder eigentlich unmöglich.

00:44:29: Und wie siehst du dann grundsätzlich das Thema der Kosten, die dadurch entstehen wenn man jetzt auf externe Anbieter angewiesen ist?

00:44:39: Ihr reicht das ganze Jahr weiter.

00:44:42: Wenn ich das richtig verstehe ihr habt ja nicht die All You Can Eat Subscription sondern ihr macht quasi Paper Use so dass ihr da zumindest rechnerisch das immer sehr gut abwegen könnt.

00:44:56: Aber man sieht ja jetzt auch die ersten Leute, die darüber sprechen.

00:44:59: Okay wir haben die Kosten unterschätzt, die entstehen wenn man diese Agents sehr in der Breite einsetzt im Unternehmen.

00:45:05: Es entstehen einfach enorme Kosten und vor allem ist es immer eine Diskussion bleiben die Kosten so?

00:45:11: Ist das alles subventioniert oder nicht?

00:45:15: Wie siehst du das?

00:45:18: Ich glaube die ersten Würfel sind da schon gefallen.

00:45:22: also ich glaub Anthropik hat jetzt angefangen auf ihren Enterprise-Planen auch auf Usage Base Pricing umzusteigen und die ganzen Coding Produkte aktuell sind extrem subventioniert.

00:45:39: Ihr könnt euch da genug Blockposter erinnern, ich sage jetzt nicht dass ich die besten Zahlen habe aber Ich würde für so Power User sagen hast du dann ein Extremes Multiple was Du an mehr Kosten hast im Vergleich zu was diese Subscription einbringt?

00:45:57: Weil die zweihundert Euro im Monat, das verbrauchen manche Nutzer einfach am Tag.

00:46:04: Und dementsprechend unprofitabel bist du auch und ich glaube es ist nicht nachhaltig was wir aktuell auf dem Markt sehen dass das die ganzen Firmen weiter betreiben.

00:46:20: geben eben die Kosten weiter.

00:46:21: Also ich glaube Quinn hatte da irgendwann mal, unser CEO hat ja irgendwann mal einen interessanten Pause das er gesagt hat wir sind der einzige profitable Coding Agent auf dem Markt weil wir es eben nicht machen.

00:46:32: und dann ist es bei uns eben die Frage hey dieses plus X-Pricing.

00:46:37: also wir haben im Enterprise Plan machen wir eben Profit dass wir haben sind wir gut genug?

00:46:44: oder ist unser Produkt?

00:46:47: Gut genug dass es diesen Aufpreiswert ist?

00:46:51: Und genau das ist der Fokus.

00:46:52: Wir können letztendlich unsere Kostenbasis nicht stark runtertreiben, weil wir von den IPI-Kosten abhängig sind.

00:47:01: Ich würde sagen aktuell sind wir es wert und das ist letztendling schwer objektiv zu beurteilen.

00:47:08: aber was wir oft hören ist dass wir auch token effizienter sind also dass endlich auch wenn wir ein bisschen teurer sind für Enterprises, dass wir dadurch weniger token verbrauchen.

00:47:18: einfach Kostenbasis ist geringer, sollten wir Äpfel zu Äpfeln vergleichen.

00:47:23: Also sollten die zum Beispiel direkt gegen die API von OpenAI an Anthropik laufen und ich glaube über Zeit wird sich das allgemein mehr auf einen Felden normalisieren dass alle Richtung Usage Base Pricing sich bewegen einfach nur weil AI erst fällt.

00:47:45: es ist nicht Software.

00:47:47: Ich hab laufende Energiekosten, ich habe laufenden Kosten für GPUs und die sind relativ fix pro Request basierend auf der Anzahl an Input und den aktuellen Strompreisen.

00:48:02: Und damit habe ich schon dieses lower Bar an Kosten das sich eben decken muss.

00:48:06: ProRequest Wie große Skaleneffekte da möglich sind?

00:48:11: Das wird glaube ich noch wirklich interessant zu sehen als auch der Cursor Deal von heute jetzt mit SpaceX.

00:48:17: Was können die machen?

00:48:18: Einfach nur dadurch, dass sie jetzt einen Zugang haben zu extrem viel Compute.

00:48:26: Das bleibt offen und wir glaube ich richtig interessant in der Zukunft.

00:48:31: Ja auf jeden Fall!

00:48:32: Ich mache mir da sehr viele Gedanken drüber.

00:48:37: Ich bin grundsätzlich auch ein Freund von Open Source und lokalen Modellen natürlich nicht für Coding notwendigerweise sondern kleinere Aufgaben, da habe ich tatsächlich gute Erfahrungen gemacht für so normale Assistant Tasks.

00:48:50: Funktioniert das mittlerweile tatsächlich erstaunlich gut wenn man jetzt einen Qwenn drei Punkt sieben nimmt.

00:48:57: Ich bin selber erstaunt dass das echt schon auch im Egentic Loop Dinge machen kann und dann hilfreich sein kann.

00:49:05: Aber letztendlich wird es darauf hinauslaufen, dass wahrscheinlich das Thema AI ähnlich wie bei einem Stromanbieter ist.

00:49:14: Rekoding an Peter und sagt das tatsächlich dann wirklich usage-based, weil anders kann es sich natürlich einfach nicht rechnen.

00:49:24: Und was würde... Bei uns ist halt auch mit die Hoffnung dass nicht nur ein Player dominiert.

00:49:28: also ich glaube sollte jetzt ein Player wirklich dieses hauptdominante Modell rausbringen und es gibt keine Chance mehr oder ein anderer Gepleite.

00:49:38: Es ist schlecht für uns.

00:49:39: aber ich glaube es ist halt schlecht für den Markt allgemein Weil du auf einmal so einen kompletten Market Capture hast von den Unternehmen, dass alle Kunden letztendlich zu einem Anbieter gehen müssen.

00:49:52: Ich hoffe das passiert nicht!

00:49:55: Ich höre auch immer so gemischte Stimmen... Ob open so ist das eine hoffnung hat oder nicht.

00:50:01: also ich es geht so monat zu monat.

00:50:04: in einen monat sagen dann auf einmal wieder viele leute hey opens us wir sind so knapp dran es geht alles weiter.

00:50:15: Im direkten Vergleich ist es halt immer ein Abstand.

00:50:18: Es hinkt halt immer mehr mal weniger zurück, ich glaube die Erwartungshaltung ist wichtig dass man sagt okay das geht nicht darum zu sagen das Modell ist exakt genauso gut wie die großen Anbieter sondern eher um die Frage was können denn Open Source Modelle machen wo ich den Use Case einfach laufen lassen kann im Hintergrund sozusagen wirklich dann am Ende nur einmal Investition und Strompreise ist, ich glaube.

00:50:43: Am Ende wie gesagt wird zu Hybrid sein?

00:50:44: Ich glaube man will immer die absolut beste Intelligenz für bestimmte Aufgaben haben.

00:50:50: aber die Frage ist braucht man das für wirklich alle Aufgaben?

00:50:53: also muss es dann immer ein Open AI oder ein Thropic Modell sein oder kann man das Ganze nicht irgendwann mal aufteilen auf bestimmte Use Cases auch abhängig natürlich davon auch wie zum Beispiel Datenschutz Anforderungen stehen bleibt aber auf jeden Fall spannend, das zu beobachten.

00:51:09: Ich glaube am Ende ist das Thema Geld natürlich der entscheidende Faktor und da sind Open AR und Co natürlich weit weg was sie investieren können in solche Training Runs.

00:51:19: und ich glaube irgendwann kommt der Punkt an dem dass rein über Open Source einfach nicht mehr gemacht wird wo auch chinesische Unternehmen sieht man ja jetzt schon immer mehr chinesischen Unternehmen geben ihren neuesten Modellen dann keine Commercial Dizenz oder machen die gar nicht Open Source.

00:51:35: Ich glaube, dass wir tatsächlich wahrscheinlich noch länger das sehen werden.

00:51:40: Dass die besten Modelle auf jeden Fall Close Source bleiben werden.

00:51:44: aber ich bin bei dir und habe auch die große Hoffnung, dass es nicht ein Anbieter sein wird sondern möglichst viele.

00:51:50: Das wäre für euch natürlich wäre das natürlich Best Case weil ihr sucht euch dann wirklich immer die Modelle raus die für eure derzeitigen Funktionalitäten Sinn machen.

00:52:01: Ja und dann läuft's halt in so die Richtung wie Apple Intelligence.

00:52:07: also ... wo sie versucht haben, hey okay was kann ich lokal bearbeiten?

00:52:10: oder... ...was muss sich auf einen privaten Server eskalieren?

00:52:14: So dieses Modell Routing.

00:52:15: Was auch glaube ich mit GPT... Ich glaub vor ONE war's ein bisschen auf die Fresse geflogen ist.

00:52:23: Also wie entscheide ich?

00:52:24: hei gehe ich zum Großen, zum Kleinen... ...oder zum Thinking-Modell.

00:52:27: Wo Sie versucht haben das automatisch zu routen.

00:52:30: Das ist glaube ich immer noch sowas was... ...bisschen schweres richtig gutzumachen einfach nur weil es... extrem abhängig ist vom Nutzer und wie der Nutzer seine Aufgabe formuliert, weil oft ist es so hey... Der Nutzer stellt am Anfang eine Frage.

00:52:47: Und es schaut aus als würde einfach nur ne einfache Frage stellen aber dann entwickelt sich das dann doch in Hey ich will jetzt irgendein komplexes Problem lösen.

00:52:57: Und gehe ich da nochmal zu den anderen Bundel?

00:53:01: Dann schmeiß' ich aber extrem viel an Arbeit die schon gemacht habe weg Weil ich den Cash baste, weil ich Modell wechsle.

00:53:09: Und dadurch habe ich diese Zusatzkosten.

00:53:11: dann ist es nicht nur eine Entscheidung hey... ...ist die Aufgabe komplex sondern ist es basierend auf wie viel ich schon gearbeitet hab und was ich schon gemacht hab sinnvoll zu wechseln.

00:53:21: also ist es diese Zusatzkosten wert?

00:53:23: Ich glaube das ist so ein Trade-off Spiel.

00:53:25: was aktuell will ich sagen sind die Modelle noch nicht gut genug um

00:53:29: gut zu routen.

00:53:30: Ich bin auch tatsächlich kein Fan von diesem Model Routing Ansatz.

00:53:34: Ich glaube, also für mich persönlich und in der Anwendung später, glaub ich macht es schon heute einfach Sinn nach Use Cases zu sortieren.

00:53:43: Und zu sagen okay ich weiß dieses Modell kann zum Beispiel meine E-Mails sortieren ohne Probleme.

00:53:48: dann benutze ich immer dieses Model dafür und für keine Ahnung Recherche im Rechtsbereich habe ich halt ein anderes Modell dann immer.

00:53:56: das ist glaube ich aktuell noch die Einfachere Abwägung als dieses Routing, weil dann ist auch die Frage wie debuckst du das hinterher?

00:54:02: Also wie stellt so fest was besser funktioniert.

00:54:04: Was schlechter funktioniert dass es dann wird dann glaube ich schon echt sehr schnell sehr komplex.

00:54:09: Ich bin einfach ein Freund davon Option zu haben.

00:54:12: Ich glaube da decken sich unsere Meinung.

00:54:14: ihr habt auch gerne mehrere option in petto und nicht alle Eier in einem korb.

00:54:21: Du hast es schon erwähnt, ne?

00:54:22: Du hast an der TU München studiert.

00:54:25: Du hast auch in Deutschland... du hast ja immer noch ein Unternehmen in Deutschland wenn ich das richtig gesehen habe was quasi KI Services anbietet.

00:54:34: Hast aber auch gesagt hier in Deutschland ist es sehr schwierig.

00:54:37: Was sind denn da so Dinge die sich aus deiner Sicht ändern müssten damit wir hier irgendwie wieder Ja, ich will nicht sagen Anschluss finden weil es hängt davon ab von dem Bereich aber gerade im Bereich KI und Geschwindigkeit da sind wir natürlich gar nicht gut aus meiner Sicht.

00:54:55: Ich glaube in Deutschland du hast kulturelle Probleme und dann hast du strukturelle Probleme.

00:55:07: Es sind vor allem im Vergleich zu, wenn du dir Silicon Valley anschaust.

00:55:11: Und vor allem ich finde da hat Y Combinator sehr viel vorangebracht dass sie einfach diese Kosten an Ich gründe ein Unternehmen und es scheitert haben Sie nicht nur reduziert sondern sie haben es eigentlich in was Positives entwickelt das es positiv ist für deinen Lebenslauf für dein CV.

00:55:29: was zu gründen bei Bicombinator zu sein, den Start-up aufzubauen und dann letztendlich zu scheitern.

00:55:33: Das ist meistens danach dein Lebensaufschau richtig gut aus weil du eben bei AC warst und in den Start up.

00:55:40: Und ich glaube das ist eben ein großer Punkt der uns in Deutschland fehlt.

00:55:44: so diese Bereitschaft zu grünten isst viel geringer dadurch dass dieses Risiko viel höher erscheint weil die Akzeptanz zu gründen und zu scheiten einfach viel gerengeres.

00:55:58: dann strukturell, fehlt uns einfach extrem viel Infrastruktur.

00:56:01: Also an der Turm vor allem extrem viele von meinen Kommilitonen die gründen gehen zu bei sie oder gehen in die USA und wenn Sie hier gründen oder hier bleiben ist es trotzdem eine amerikanische Firma oder ne amerikanischer Motorfirma.

00:56:19: einfach nur dass sie Geld einsammeln können aus der USA weil ich schon mindestens das wahrscheinlich fünf bis zehnfache an Bewertung bekommen, mit besseren Terms.

00:56:29: Was du in Deutschland hier einfach nicht hast.

00:56:31: Das sind halt extrem viele, wie sie hasst die keine großen Runden machen können aber auch ein bisschen die Arschgeier sind.

00:56:39: und der andere strukturelle Part ist halt die ganze regulatorik oder das ganze rechtliche was ich erfüllen muss.

00:56:45: also wir haben ja eine Einfirma also benutzen wir ein bisschen als Holding, wir haben eine Subfirma in der USA und er ist subfirma.

00:56:56: Es ist in Deutschland einfach so viel Aufwand, eine Firma zu betreiben den ganzen Rechtskram zu machen und auch einen Überblick zu behalten über den ganzen rechtsklam als Einzelperson oder als mehrere Gründer.

00:57:11: Du hast so viele... ... Blöcke im Weg, über die du erst mal kommen musst bevor du deine Firma gründest.

00:57:18: Und dann hast du immer noch so viele Blöcke im Weg... ...die eigentlich nichts mit der Arbeit zu tun haben sondern einfach nur damit hey ich muss mich mit der Buchhaltung, mit der Steuer und mit den anderen Schmarrn auseinandersetzen was ein Start-up nicht tun sollte.

00:57:32: Du solltest dich darauf fokussieren dass du ein gutes Produkt produzierst und nicht das du zweieinhalb Wochen mit deinem Buchhalt helfen kannst Und ich glaube, das macht das Ganze halt extrem schwierig.

00:57:43: Also auch diese UG sinnvolles Konstrukt – Ich kann's billig gründen aber es dauert ewig!

00:57:48: Erstmal muss ich zum Notar laufen dann der notarmacht meine Handelsregister-Anmeldung.

00:57:52: da bekomme ich wieder ein Brief, denn muss sich das alles bezahlen an drei verschiedene Adressanten.

00:57:58: Dann habe ich noch fünf verschiedene Anmeldungen die ich gleichzeitig auch noch machen muss, dann hab' ich auf einmal eine UG und dann meine UG läuft Schreib gute Zahlen, ich hab Umsatz.

00:58:07: Da muss ich mich auf einmal mit Umsatzsteuer und den ganzen Spaß auseinandersetzen sobald ich über diesen Level rauskomme.

00:58:13: Und dann habe ich im nächsten Jahr wenn ich es mache wahrscheinlich meine weil ich mich selber damit noch nicht auskennt da habe ich Steuervorauszahlungen und auf einmal jetzt wo's richtig gut läuft Ich reinvestiere mein Kapital kriege ich meine Steuervorauszahlung in die Fresse und Dann genau in diesem Punkt.

00:58:30: Ich habe zu viele Freunde von mir gesehen die damit in finanzielle Schwierigkeiten gelaufen sind, einfach nur weil sie sich nicht komplett damit auskennen.

00:58:36: Sie haben das noch nicht durchgemacht und sie haben reinvestiert was ja eine Firma machen sollte, haben Panda-Leute geheiert, haben Gehälte ausgezahlt, haben Maschinen oder was auch immer eingekauft... Und dann kommt meine Steuerrechnung an, dann hauke ich da erstmal los, okay kacke!

00:58:52: Und ich glaube es sind halt einfach so viele kleine Probleme die zusammengesetzt ist einfach wahnsinnig schwermachen in Deutschland was zu gründen und was zu machen.

00:59:03: Dann halt noch die oder auch ein bisschen so kulturell, die Kundenseite.

00:59:07: Es ist einfach diese Akzeptanz nicht da neue Produkte auszuprobieren und neuere Meereskante Sachen zu adoptieren.

00:59:17: also in Deutschland Einkäufe gehen halt meistens in größeren Unternehmen durch.

00:59:22: die Compliance Abteilung Da musst du erstmal durch, dauert extrem lang.

00:59:25: Also du hast von Tag eins direkten Enterprise Sales Prozess für alles kostet extrem viel.

00:59:31: In der USA auch wieder weit kommen.

00:59:34: nicht das beste Beispiel, du startest die Firma und die verkaufen extrem viel innerhalb von YC selber an früherer YC Unternehmen.

00:59:43: Die halt einfach direkt erst mal.

00:59:44: hey klar es ist ein bisschen ne Bayes da eine Tendenz einfach ja zu sagen hey komm wir geben den jetzt einfach mal ne Chance.

00:59:51: wie benutzen das?

00:59:52: aber dadurch haste erstmal die ersten paar Kunden durch die ersten Erfolgsmomente.

00:59:55: Du kannst sie so ein bisschen in den Kunststamm aufbauen Die Logos auf deiner Webseite klatschen, was immer so ein bisschen.

01:00:03: ich hab schon vier fünf Kunden.

01:00:04: es ist einfacher zu adoptieren für andere Leute die es noch nicht gemacht haben.

01:00:09: Und... Ich sehe aber auch in Deutschland wirklich die Impulse dass wir uns in so eine Richtung entwickeln wollen.

01:00:17: also AI-Act klar sie wollen das jetzt reduzieren aber es wird nicht mal zurückgebaut.

01:00:24: was ich an existierenden Problemen habe Und ich glaube, das ist auch so dieser der Amp Spirit.

01:00:32: Ich glaub oft is die beste Tendenz nicht irgendwas Neues hinzuzufügen sondern was Existieren des abzubauen und ich glaube dass es vor allem in Deutschland wäre das notwendig da sich eine Start-up Kultur besser aufbauen können.

01:00:45: Dass ihr einfach das viel einfacher macht.

01:00:48: also ob das jetzt zum Beispiel ein flat Steuersatz Und du bist fertig für Unternehmen und nicht diese Komplexität.

01:00:57: Hey, ich habe je nachdem in welchem Bereich ich bin was auch immer ich habe habe verschiedene Steuersätze.

01:01:04: Wenn man da Sachen einfach viel einfacher macht, Sachen reduziert, Sachen abbaut haben wir auch mehr Unternehmen die hier etwas machen.

01:01:11: unwahrscheinlich dann am Ende auch wenn wir mehr Unternehmen bekommen mehr Steuereinnahmen obwohl wir vielleicht Steuern reduzieren oder andere Sachen wiederabbauen.

01:01:23: Ja, also ich kann dir da nur über eine Sache zustimmen.

01:01:25: Ich habe das auch tatsächlich selber in einigen Bereichen schon durchgemacht und... ...ich bin aber den Ansatz gut!

01:01:32: Also die Idee gut, den Amp-Ansatz zu fahren.

01:01:35: lasst uns einfach Feature rausnehmen aus unserem komplexen System.

01:01:38: Lass uns das System vereinfachen.

01:01:41: Das ist zumindest eine gute Vision auf die man hinarbeiten könnte.

01:01:44: Aber dafür muss natürlich der Wille da sein und das gemeinsame Verständnis.

01:01:49: Wir tun zwar jetzt hier auf Seiten von von Frauenhofer und auch im regionalen Kontext schon alles, alles erdenklich mögliche um da zumindest darauf hinzuweisen was besser sein könnte aber das ist meistens auch leider nur ein Tropfen auf dem heißen Stein.

01:02:04: Ja und ich glaube der ist halt einfach einen Koller... Es ist jetzt ein Rand weil es ein Rand ist.

01:02:08: Ich finde es ist auch

01:02:09: komplett legitim also es befindet mich oft wieder.

01:02:16: Ja und ich glaube es ist nicht produktiv, aber letztendlich ist das einfach nur eine Beschwerde.

01:02:19: Aber da ist halt auch irgendwie so... Es gibt genug Leute in Deutschland und erzähle mich auch rein die da gern mit Rat und Tat den Leuten helfen wollen.

01:02:28: Und es gibt auch viele Politiker die was machen wollen.

01:02:32: Ich glaub der muss halt einfach ein bisschen in die Richtung gegangen werden sich zu überlegen hey erstens wie kann ich da vielleicht helfen?

01:02:40: Auch von Politikseiten zum Beispiel Einfach nur auf die Leute zugehen und Leute fragen, die vielleicht in der Branche oder... ...die Subjektexpertise haben den mit Rat und Tat zur Seite stehen.

01:02:54: Dass sie einfach sagen können hey das ist falsch.

01:02:57: Das ist richtig.

01:02:58: Und ich glaube es gibt sehr viele Leute in der Industrie.

01:03:02: Ich will dafür keine Bezahlung.

01:03:03: Ich würde es gerne haben weil ich will sehen.

01:03:05: Deswegen habe auch meine Unternehmen hier.

01:03:07: Ich wil sehen dass es in Deutschland vorangeht.

01:03:09: Ja.

01:03:09: Und.. ..ich glaub das ist ja einfach so ein Ding.

01:03:12: da die Leute brauchen wir ein bisschen mehr Bereitschaft, einfach nur andere Leute um Hilfe zu fragen.

01:03:18: Und ich glaube so könnte es auch weitergehen.

01:03:20: aber da ist es halt auch... alles in seiner eigenen Bubble und greift nicht wirklich nach raus oder versucht nicht mit anderen Leuten zusammenzuarbeiten oder zu verstehen was deren Probleme damit sind?

01:03:36: Aber ich finde es auf jeden Fall wichtig zu sehen, deshalb mache ich tatsächlich auch diese Interview-Reihe.

01:03:41: Ich will halt zeigen in Deutschland und Europa.

01:03:43: wir haben die Leute, die Bock haben, die innovativ denken, die grundsätzlich da sind.

01:03:49: das drumrum ist halt das Problematische.

01:03:52: also ich bin tatsächlich fest davon überzeugt dass wir wirklich genug Leute hätten.

01:03:57: nur wir vergraulen viele leider davon durch die Schwierigkeiten die hier einfach vorherrschen im System.

01:04:03: Aber vielleicht genug granted, zum Abschluss noch mal ein kurzer Blick nach vorne.

01:04:10: Du sagst selber es gibt immer wieder so Sprünge in den Modellen dass die Modelle besser werden.

01:04:14: wir haben jetzt Ankündigungen von Spud von OpenAI Cloud Mythos das jetzt Cyber Security technisch wohl alles niedermetzeln soll schwachstellen überall finden soll.

01:04:26: was ist so deine Deine Einschätzung, ich meine vorausschau ist mal schwierig.

01:04:31: Aber was ist so dein Gefühl?

01:04:33: Wo geht die Reise hin?

01:04:35: Also... Ich glaube die Modelle werden besser in den Sachen, die ich aktuell messe und das ist glaub' ich auch ein solcher großer Punkt Ist Mythos zu einem krasser Sprung an Performance oder ist es dadurch dass ich jetzt einfach angefangen habe zu messen hey wie viele Cyber Security Lücken Kann ich finden, dass das Modell in diesem Problem oder in diesen Subbereich besser geworden ist?

01:05:03: und nicht glaube es weiteres.

01:05:05: Ich habe angefangen es zu messen.

01:05:06: Ich hab angefangen darauf zu trainieren und jetzt hat das Modellen Entspurung in den Fähigkeiten in diesem Bereich Und... Das war bis jetzt eigentlich so mit dieser der rote Faden die sich so durchgezogen hat.

01:05:20: Wir hatten immer Benchmarks die gewisse Sachen gemessen haben zum Beispiel Long Context Reasoning also wie gut kann das Modelle mit sehr sehr langen Input umgehen, auch jetzt zum Beispiel.

01:05:30: wir hatten SweeBench, Terminal Bench die einfach nur diese Coding spezifischen Fähigkeiten gemessen haben.

01:05:36: Jetzt haben wir ein paar neue, die sich darauf fokussieren wie kann das Modell mit sehr schwierigen Coding-Aufgaben umgehen?

01:05:45: Die meistens mehrere Millionen Token brauchen.

01:05:49: also es misst nicht nur hey wie gutes Modell in einen Kontext Windows sondern über Kontext windows sind weg.

01:05:56: und Durch diese Benchmarks glaube ich halt, dass es wirklich sehr spezifisch in diesen Bereichen die Modelle auch besser werden.

01:06:03: Und das wird jetzt glaube ich mit Compaction und mit diesem Benchmark kann ich erwarten, dass das Modell einfach viel länger an einem Problem arbeiten kann... ...und sich damit auseinandersetzen kann.

01:06:15: Ich glaube da ist ein bisschen ein Aufruf wenn du willst als Modell in gewissen Bereichen besser wird!

01:06:20: Das erste was ich machen würde ist der Benchmarkt aufsetzen und ein paar Tests zu definieren.

01:06:25: Wie kann ich das wirklich gut messen, ob das Modell gut ist?

01:06:28: Und was sind gute Aufgaben die für aktuelle Modelle sehr schwierig sind.

01:06:35: Ich glaube, dass es auch ein Bereich der in der Zukunft sehr wichtig sein wird, so Benchmark zu stellen und Evaluations also wie evaluiere ich ein Modell, damit der Wichtigste sein wird?

01:06:48: Ich glaube aktuell sehen wir wirklich wieder eine Tendenz, dass Modelle noch ein bisschen größer werden.

01:06:52: Also ich glaube Mythos ist wieder extrem groß, aber wahrscheinlich auch in der Vergangenheit war das immer so ein bisschen Synos.

01:07:02: also wir hatten einen schönen ist in der Wahl ist es größer geworden und dann ist er wieder kleiner geworden, weil sie wieder destilliert hat.

01:07:07: Dann ist es wieder größer worden.

01:07:09: Ich denke das wird so weitergehen Aber eigentlich bis jetzt.

01:07:13: jedes Mal wenn ich gesagt habe oder erwartet hab hey Wir sind jetzt noch am Ende von der erst Kurve gab's wieder nen, nen Step Change.

01:07:21: Also... ...bis jetzt sehe ich noch nicht dass es viel langsamer wird.

01:07:26: Inzwischen macht das Aufgaben die davor im reinen menschlichen Bereich waren.

01:07:35: Ich glaube der Trend wird auch noch weitergehen einfach nur dadurch, dass wir einfach die bessere IWA ist.

01:07:42: Wir bringen den Modell besser bei und haben bessere Trainingsdaten.

01:07:46: die richtigen Experten benutzen jetzt auch diese Modelle.

01:07:48: Ich glaube, es gibt fast keinen mehr der in irgendwie Knowledgework unterwegs ist, der nicht GPD etc.

01:07:56: benutzt.

01:07:57: dementsprechend haben wir viel bessere Daten auf einmal wo Experten diese Modellen benutzen und Probleme lösen.

01:08:06: Ich erwarte nicht, dass dieser Fortschritt jetzt wahnsinnig absteigt.

01:08:11: Es ist immer so es flacht ab dann sind so zwei drei Modelle Releases die nicht so krass sind und dann hast du eigentlich wieder einen Step Change.

01:08:18: also ich denke das wird auch noch weiter gehen für eine gewisse Zeit Und wenn nicht allgemein dann in gewissen Subbereichen.

01:08:25: Das hat wirklich ein Bereich war vielleicht sehr schlecht die Cyber Security oder es waren nicht so gut.

01:08:29: und jetzt Cyber Security auf einmal extrem auch mit den Trainingsdaten.

01:08:34: Ja, ich bin auch sehr vorsichtig geworden.

01:08:37: Ich wurde immer wieder überrascht von den Verbesserungen in den Modellen und für mich stellt sich halt die Frage wie lange sind wir noch diejenigen, die diese Sachen als Tools benutzen?

01:08:49: oder kommt irgendwann der Punkt wenn man selber wirklich komplett abgehängt wird?

01:08:53: Wie siehst du das?

01:08:59: Also ich glaube es ist softwareentwicklerer.

01:09:01: Er waren schon immer so.

01:09:02: du hast immer neue Sachen gelernt, weil sie die Technologie einfach weiterentwickelt.

01:09:05: Es gibt neue Technologien auf den Markt kommen und das alte ersetzen.

01:09:09: Dementsprechend war mir eh schon immer sowas.

01:09:11: Du hast dich nicht damit definiert was für ein Texteck du heute kannst, sondern letztendlich... Du bist ein Software-Entwickler, du bist hier um Probleme zu lösen und letztendig benutzt du die Tuis, die du aktuell hast.

01:09:21: aber Probleme lösen ist natürlich die Aufgabe dahinter.

01:09:24: ich glaube jetzt nicht dass es weggehen wird problemen zu lösten.

01:09:28: Die Umsetzung davon ändert sich.

01:09:32: Ich bin vielmehr auf einem höheren Level unterwegs, viel mehr konzeptionell und verbringen mehr Zeit damit Probleme zu lösen.

01:09:39: Die Allgemein glaube ich auch dass die.

01:09:43: der Bedarf an Software ist bis jetzt limitiert gewesen durch das Angebot an Software-Entwicklern die ich habe die das quasi bieten können.

01:09:55: Diese Restriktion geht auf einmal weg, aber ich glaube dadurch wird halt auch die Nachfrage an Software so enorm ansteigen und ich glaub das ist einfach so.

01:10:05: Wir haben so wenig Software für wie viele Probleme und wie kassem ich diese oder wie personellisierig Software entwickeln könnte?

01:10:12: Und ich glaub dass wir ein interessanter... ein interessanter Trend.

01:10:16: und deswegen denke ich auch nicht, dass diese Gefahr für wenn du in deinem Bereich gut bist.

01:10:21: Du brennst dafür, du willst weiter lernen, du willst dich weiterentwickeln und bist da aktiv dahinter glaube ich nicht das du so schlechte Chancen in der Zukunft hast, solange du halt wirklich versuchst dich mit der Technologie weiter zu entwickeln und am Stande Dinge zu bleiben.

01:10:39: Ja, es ist ein super Abschlussstatement.

01:10:41: Ich sage auch immer die zwei wichtigsten Faktoren aus meiner Sicht sind Motivation und Neugierde.

01:10:46: Und darüber kannst du schon echt sehr viel abfangen weil dann wirst du inherent immer versuchen am Ball zu bleiben neue Dinge zu lernen, Dinge auszuprobieren und ich hatte letztens zum Beispiel auch eine Gruppe Schüler hier wo ich den aktuellen Stand vorgestellt habe im Bereich KI Und da habe ich das auch wieder gesehen.

01:11:03: Also die waren erstens sehr, sehr gut informiert.

01:11:05: also das hat mich tatsächlich beeindruckt aber die haben tatsächlich auch natürlich gefahren.

01:11:10: was sind denn so die Fähigkeiten die wir brauchen?

01:11:12: Ich glaube sowas wie Motivation und Neugierde.

01:11:14: Das sind zwei sehr wichtige Faktoren und freut mich auf jeden Fall zu hören dass du es ähnlich

01:11:19: siehst.

01:11:20: Ja perfekt

01:11:22: Alles klar, Nicolai.

01:11:23: Vielen vielen Dank!

01:11:24: Hat mir super viel Spaß gemacht.

01:11:26: wie immer bei fast allen Interviews sage ich es am Ende Ich könnte noch Ewigkeiten weiterreden.

01:11:30: auch hier ist das gerade so.

01:11:31: Ich glaube wir haben tausend Themen über die wir noch sprechen können.

01:11:35: Können wir natürlich vielleicht in Zukunft einmal wiederholen.

01:11:38: gerne wenn du bereit dafür bist.

01:11:41: Ja Wie gesagt vielen, vielen Dank und ich wünsche euch weiterhin viel Erfolg mit AMP.

01:11:45: Ich werde das auf jeden Fall auch weiter beobachten was ihr für coole neue Ideen habt und in welche Richtung sich das weiterentwickelt.

01:11:53: Danke dass ich hier sein durfte und auch hier loben an dich also mit eines der angenehmsten und besten Interviews die ich glaube ich gemacht habe.

01:12:01: Vielen Dank!

01:12:02: Das freut mich sehr zu hören.

01:12:05: Mach's gut!

01:12:06: Ciao.

Shownotes

Transkript anzeigen

Neuer Kommentar