Vielen Dank für das Feedback.
Wir basieren diese Entscheidung nicht direkt auf den Zahlen von YT-Videos. Ich bin auch eigentlich sicher, das nur als Beispiel genannt zu haben, weil man da halt mal eine konkrete Zahl hat, aber vermutlich habe ich das sehr missverständlich ausgedrückt.
Nochmal fürs Protokoll: Wir finden die Folgen von SFT zu lang, das ist erstmal eine grundsätzliche Erwägung - die Aufnahmen sind zu mühsam, die Soundproduktion ist zu mühsam, die Bebilderung ist viel Arbeit am Stück, die Files werden sehr groß und buffern in manchen Apps ewig etc.
Wir haben das auch beim ersten Mal so erklärt. Als dann eine Woge der Entrüstung über uns weggespült ist, habe ich als Beispiel die Zahl von YT mal in die Diskussion im Forum eingebracht, zusammen mit der trivialen Erkenntnis, dass lange Folgen eher abgebrochen werden, ebenso wie lange Filme, lange Spiele, lange Bücher und vermutlich auch lange Songs. Das ist kein Werturteil über irgendwelche Personen oder den Content, das ist einfach so - je länger etwas dauert, desto eher ist man zwischendurch mal abgelenkt, verliert den Faden, steigt wieder ein und prallt dann ab. Das mit der Abbruchrate bei YT habe ich leichtsinnig in WWS wiederholt 
Nochmal: Wir basieren diese Entscheidung nicht auf irgendwelchen Zahlen von YT-Videos. Es geht uns übrigens auch nicht darum, die Views auf YT zu optimieren, das ist uns am Ende egal - wir wollen das Format in einem sinnvollen Prozess produzieren und ein taugliches Angebot für alle machen. Und ich denke, dass die Aufteilung von SFT in handliche Mikrohäppchen von, äh, 90-120 Minuten nicht der schlechteste Weg ist. Das kann natürlich ein Trugschluss sein, schau’n mer mal.
Andere Sache:
„Eine 3+ Stunden Folge muss für heutige Menschen mit geringer Aufmerksamkeitsspanne der blanke Horror sein.“
Bin nicht so Freund von Zuschreibungen bei anderen Leuten: Man kann sehr gut Longform-Content auf YT machen. Ich glaube auch nicht, das unterschiedliche Durchhörquoten bei 2h- und 3h-Folgen auf geringe Aufmerksamkeitsspannen zurückzuführen sind.
Musikvideos sind auch keine Podcasts, das ist imho überhaupt nicht vergleichbar. Man sieht das sehr deutlich an den Kurven, die ganz anders sind als deine: Unsere „Videos“ auf Yt verlieren in den ersten 2 Minuten um die 45-70 % der Zuhörer. Das sind Leute, die mal reinklicken, vielleicht was anderes erwarten, dann merken, dass das kein „richtiges“ Video ist oder dass sie die Sprecher nicht mögen oder was weiß ich. Die zählen logischerweise nicht. Von denen, die dann noch da sind, hören die meisten durch. Wieviele genau, das hängt von diversen Sachen ab, von Struktur und Drama der Folge, von der Länge, vom Thema an sich und natürlich auch ein bisschen davon, wie stark „Wackelkandidaten“ schon in den ersten Sekunden vergrault wurden 
Paar ungefähre Beispiele:
-
SFT verliert am Anfang viel, dann 2h fast nichts, dann geht es langsam runter, auf 15-20 %.
-
Das Quiz verliert mittelviel zu Beginn und dann bis zum Ende gar nichts mehr, endet eher auf 30%.
-
Eine kurze Spielefolge verliert anfangs mittelviel und dann bis zum Ende moderat, endet eher auf 25 %.
-
Eine lange Spielefolge verliert am Anfang wenig und dann durchgehend stärker, bis sie bei gleicher Länge am Ende auf SFT-Niveau ist.
Aber das tut hier eigentlich nix zur Sache, ist nur ein Exkurs, mir ging es nur darum, das mit den Aufmerksamkeitsspannen nicht so stehen zu lassen 