Füge erweiterten Mixcloud RSS Feed Generator hinzu, der echte Audio-URLs extrahiert. Aktualisiere README, um neue Nutzungshinweise und Funktionen zu reflektieren. Ergänze Skripte für Serverstart und Feed-Aktualisierung. Aktualisiere Anforderungen in requirements.txt und füge uv.lock hinzu.

This commit is contained in:
2025-07-05 17:13:16 +02:00
parent a74162f4eb
commit 22c18a2f77
6 changed files with 465 additions and 15 deletions

View File

@ -12,28 +12,37 @@ Dieses Python-Script erstellt einen RSS-Feed aus deinen Mixcloud-Tracks, damit d
## Verwendung
### RSS-Feed erstellen
### RSS-Feed mit echten Audio-URLs erstellen (empfohlen)
```bash
uv run python mixcloud_rss_pro.py serman_dj
```
Das erstellt eine `mixcloud_feed.xml` Datei mit **echten Audio-Streams**, die in Podcast-Apps abspielbar sind.
### Original-Version (nur Mixcloud-Links)
```bash
python mixcloud_rss.py serman_dj
```
Das erstellt eine `mixcloud_feed.xml` Datei mit deinen neuesten Mixcloud-Tracks.
### Erweiterte Optionen
```bash
# Feed mit 100 Tracks erstellen
python mixcloud_rss.py serman_dj --limit 100
# Feed mit 100 Tracks erstellen (mit Audio-URLs)
uv run python mixcloud_rss_pro.py serman_dj --limit 100
# Feed in spezifische Datei speichern
python mixcloud_rss.py serman_dj --output mein_feed.xml
uv run python mixcloud_rss_pro.py serman_dj --output mein_feed.xml
# Schnellmodus ohne Audio-Extraktion
uv run python mixcloud_rss_pro.py serman_dj --no-audio
# HTTP-Server starten für den Feed
python mixcloud_rss.py serman_dj --serve
uv run python mixcloud_rss_pro.py serman_dj --serve
# Server auf anderem Port starten
python mixcloud_rss.py serman_dj --serve --port 8080
# Server-Wrapper verwenden (automatische Updates)
python start_server.py
```
### RSS-Feed in Podcast-App hinzufügen
@ -48,19 +57,28 @@ python mixcloud_rss.py serman_dj --serve --port 8080
## Funktionen
- ✅ **Echte Audio-URLs**: Extrahiert direkte Audio-Streams für Podcast-Apps
- ✅ Holt automatisch deine neuesten Mixcloud-Tracks
- ✅ Erstellt RSS-Feed im Podcast-Format
- ✅ Unterstützt iTunes-Tags für bessere Kompatibilität
- ✅ Inkludiert Track-Metadaten (Titel, Beschreibung, Dauer, Tags)
- ✅ Eingebauter HTTP-Server zum Testen
- ✅ Konfigurierbare Anzahl von Tracks
- ✅ Parallele Audio-URL-Extraktion für bessere Performance
## Audio-Streaming
🎉 **Problem gelöst!** Das neue `mixcloud_rss_pro.py` Script extrahiert echte Audio-URLs, die in Podcast-Apps abspielbar sind:
- ✅ Direkte `.m4a` Audio-Streams
- ✅ Korrekte Content-Types für Podcast-Apps
- ✅ Funktioniert mit Apple Podcasts, Spotify, etc.
## Bekannte Einschränkungen
**Audio-Streaming:** Mixcloud erlaubt kein direktes Audio-Streaming ohne Autorisierung. Die generierten Links verweisen auf die Mixcloud-Webseite. Für echtes Audio-Streaming müsste man:
~~**Audio-Streaming:** Mixcloud erlaubt kein direktes Audio-Streaming ohne Autorisierung.~~
1. Die offizielle Mixcloud API für Streaming verwenden
2. Oder eine Alternative wie yt-dlp für das Extrahieren der Audio-URLs nutzen
**✅ Gelöst:** Mit `yt-dlp` werden jetzt echte Audio-URLs extrahiert!
## Troubleshooting
@ -73,6 +91,13 @@ python mixcloud_rss.py serman_dj --serve --port 8080
- Überprüfe, ob der HTTP-Server läuft
- Teste die URL im Browser: `http://localhost:8000/mixcloud_feed.xml`
- Verwende die Pro-Version: `uv run python mixcloud_rss_pro.py serman_dj`
### Audio wird nicht abgespielt
- ✅ **Gelöst:** Verwende `mixcloud_rss_pro.py` für echte Audio-URLs
- Die Pro-Version extrahiert direkte Audio-Streams
- Dauert länger, aber funktioniert in allen Podcast-Apps
## Beispiel-Ausgabe

359
mixcloud_rss_pro.py Normal file
View File

@ -0,0 +1,359 @@
#!/usr/bin/env python3
"""
Erweiterte Mixcloud RSS Feed Generator mit Audio-Streaming
Extrahiert echte Audio-URLs für die Wiedergabe in Podcast-Apps.
"""
import requests
import xml.etree.ElementTree as ET
from datetime import datetime
import json
import time
from urllib.parse import quote
import argparse
import os
import yt_dlp
from concurrent.futures import ThreadPoolExecutor, as_completed
import threading
class MixcloudRSSGeneratorPro:
def __init__(self, username, output_file="mixcloud_feed.xml", extract_audio=True):
self.username = username
self.output_file = output_file
self.extract_audio = extract_audio
self.base_url = "https://api.mixcloud.com"
self.user_url = f"{self.base_url}/{username}/"
self.audio_cache = {}
self.cache_lock = threading.Lock()
def get_user_info(self):
"""Holt Benutzerinformationen von Mixcloud."""
try:
response = requests.get(self.user_url)
response.raise_for_status()
return response.json()
except requests.RequestException as e:
print(f"Fehler beim Abrufen der Benutzerinformationen: {e}")
return None
def get_cloudcasts(self, limit=50):
"""Holt die neuesten Cloudcasts (Tracks) des Benutzers."""
cloudcasts_url = f"{self.user_url}cloudcasts/"
params = {"limit": limit}
try:
response = requests.get(cloudcasts_url, params=params)
response.raise_for_status()
data = response.json()
return data.get("data", [])
except requests.RequestException as e:
print(f"Fehler beim Abrufen der Cloudcasts: {e}")
return []
def extract_audio_url(self, mixcloud_url):
"""Extrahiert die echte Audio-URL mit yt-dlp."""
if not self.extract_audio:
return mixcloud_url
# Cache prüfen
with self.cache_lock:
if mixcloud_url in self.audio_cache:
return self.audio_cache[mixcloud_url]
try:
ydl_opts = {
'quiet': True,
'no_warnings': True,
'format': 'best[ext=m4a]/best', # Bevorzuge m4a für bessere Podcast-Kompatibilität
'extractaudio': False,
'noplaylist': True,
}
with yt_dlp.YoutubeDL(ydl_opts) as ydl:
info = ydl.extract_info(mixcloud_url, download=False)
if info and 'url' in info:
audio_url = info['url']
# Cache speichern
with self.cache_lock:
self.audio_cache[mixcloud_url] = audio_url
return audio_url
else:
print(f"⚠️ Keine Audio-URL gefunden für: {mixcloud_url}")
return mixcloud_url
except Exception as e:
print(f"⚠️ Fehler beim Extrahieren der Audio-URL für {mixcloud_url}: {e}")
return mixcloud_url
def extract_audio_urls_parallel(self, cloudcasts, max_workers=3):
"""Extrahiert Audio-URLs parallel für bessere Performance."""
if not self.extract_audio:
return cloudcasts
print(f"🎵 Extrahiere Audio-URLs für {len(cloudcasts)} Tracks...")
def extract_for_cloudcast(cloudcast):
mixcloud_url = f"https://www.mixcloud.com{cloudcast.get('key', '')}"
audio_url = self.extract_audio_url(mixcloud_url)
cloudcast['audio_url'] = audio_url
return cloudcast
with ThreadPoolExecutor(max_workers=max_workers) as executor:
future_to_cloudcast = {
executor.submit(extract_for_cloudcast, cloudcast): cloudcast
for cloudcast in cloudcasts
}
completed_cloudcasts = []
for i, future in enumerate(as_completed(future_to_cloudcast), 1):
try:
cloudcast = future.result()
completed_cloudcasts.append(cloudcast)
print(f"{i}/{len(cloudcasts)} - {cloudcast.get('name', 'Unbekannt')}")
except Exception as e:
cloudcast = future_to_cloudcast[future]
cloudcast['audio_url'] = f"https://www.mixcloud.com{cloudcast.get('key', '')}"
completed_cloudcasts.append(cloudcast)
print(f" ⚠️ {i}/{len(cloudcasts)} - Fehler: {e}")
return completed_cloudcasts
def format_duration(self, seconds):
"""Formatiert die Dauer in HH:MM:SS Format."""
hours = seconds // 3600
minutes = (seconds % 3600) // 60
seconds = seconds % 60
return f"{hours:02d}:{minutes:02d}:{seconds:02d}"
def get_content_type_and_size(self, url):
"""Ermittelt Content-Type und Dateigröße einer URL."""
try:
response = requests.head(url, timeout=10)
content_type = response.headers.get('content-type', 'audio/mpeg')
content_length = response.headers.get('content-length')
# Fallback für Content-Type basierend auf URL
if 'audio' not in content_type:
if '.m4a' in url or '.aac' in url:
content_type = 'audio/mp4'
elif '.mp3' in url:
content_type = 'audio/mpeg'
else:
content_type = 'audio/mpeg'
return content_type, content_length
except:
return 'audio/mpeg', None
def create_rss_feed(self):
"""Erstellt den RSS-Feed aus den Mixcloud-Daten."""
user_info = self.get_user_info()
if not user_info:
return False
cloudcasts = self.get_cloudcasts()
if not cloudcasts:
print("Keine Cloudcasts gefunden.")
return False
# Audio-URLs extrahieren wenn aktiviert
if self.extract_audio:
cloudcasts = self.extract_audio_urls_parallel(cloudcasts)
# RSS Root Element
rss = ET.Element("rss")
rss.set("version", "2.0")
rss.set("xmlns:itunes", "http://www.itunes.com/dtds/podcast-1.0.dtd")
rss.set("xmlns:content", "http://purl.org/rss/1.0/modules/content/")
# Channel Element
channel = ET.SubElement(rss, "channel")
# Channel Metadaten
title = ET.SubElement(channel, "title")
title.text = f"{user_info.get('name', self.username)} - Mixcloud Feed"
description = ET.SubElement(channel, "description")
description.text = user_info.get('biog', f"Mixcloud-Feed von {self.username}")
link = ET.SubElement(channel, "link")
link.text = f"https://www.mixcloud.com/{self.username}/"
language = ET.SubElement(channel, "language")
language.text = "de-DE"
# iTunes-spezifische Tags
itunes_author = ET.SubElement(channel, "itunes:author")
itunes_author.text = user_info.get('name', self.username)
itunes_summary = ET.SubElement(channel, "itunes:summary")
itunes_summary.text = user_info.get('biog', f"Mixcloud-Feed von {self.username}")
itunes_category = ET.SubElement(channel, "itunes:category")
itunes_category.set("text", "Music")
# Explicit Content (für Musik meist nicht nötig)
itunes_explicit = ET.SubElement(channel, "itunes:explicit")
itunes_explicit.text = "false"
# Bild falls vorhanden
if user_info.get('pictures', {}).get('large'):
image = ET.SubElement(channel, "image")
image_url = ET.SubElement(image, "url")
image_url.text = user_info['pictures']['large']
image_title = ET.SubElement(image, "title")
image_title.text = title.text
image_link = ET.SubElement(image, "link")
image_link.text = link.text
itunes_image = ET.SubElement(channel, "itunes:image")
itunes_image.set("href", user_info['pictures']['large'])
print(f"📦 Erstelle RSS-Feed mit {len(cloudcasts)} Episoden...")
# Items (Episoden) hinzufügen
for cloudcast in cloudcasts:
item = ET.SubElement(channel, "item")
# Titel
item_title = ET.SubElement(item, "title")
item_title.text = cloudcast.get('name', 'Unbekannter Titel')
# Beschreibung
item_description = ET.SubElement(item, "description")
description_text = cloudcast.get('description', '')
if not description_text:
description_text = f"Mix von {self.username}"
item_description.text = description_text
# Link zur Mixcloud-Seite
item_link = ET.SubElement(item, "link")
item_link.text = cloudcast.get('url', '')
# GUID
item_guid = ET.SubElement(item, "guid")
item_guid.text = cloudcast.get('key', '')
item_guid.set("isPermaLink", "false")
# Veröffentlichungsdatum
item_pubdate = ET.SubElement(item, "pubDate")
created_time = cloudcast.get('created_time')
if created_time:
# Konvertiere ISO-Format zu RFC 2822
dt = datetime.fromisoformat(created_time.replace('Z', '+00:00'))
item_pubdate.text = dt.strftime('%a, %d %b %Y %H:%M:%S %z')
# Audio-Enclosure mit echter Audio-URL
enclosure = ET.SubElement(item, "enclosure")
audio_url = cloudcast.get('audio_url', f"https://www.mixcloud.com{cloudcast.get('key', '')}")
enclosure.set("url", audio_url)
# Content-Type und Größe ermitteln
if self.extract_audio and audio_url != f"https://www.mixcloud.com{cloudcast.get('key', '')}":
content_type, content_length = self.get_content_type_and_size(audio_url)
enclosure.set("type", content_type)
if content_length:
enclosure.set("length", content_length)
else:
enclosure.set("type", "audio/mpeg")
# Dauer
duration = cloudcast.get('audio_length', 0)
if duration:
item_duration = ET.SubElement(item, "itunes:duration")
item_duration.text = self.format_duration(duration)
# iTunes-spezifische Tags
itunes_title = ET.SubElement(item, "itunes:title")
itunes_title.text = item_title.text
itunes_summary = ET.SubElement(item, "itunes:summary")
itunes_summary.text = description_text
itunes_explicit_item = ET.SubElement(item, "itunes:explicit")
itunes_explicit_item.text = "false"
# Tags hinzufügen
tags = cloudcast.get('tags', [])
if tags:
keywords = ", ".join([tag['name'] for tag in tags[:5]]) # Nur erste 5 Tags
itunes_keywords = ET.SubElement(item, "itunes:keywords")
itunes_keywords.text = keywords
# XML in Datei schreiben
tree = ET.ElementTree(rss)
ET.indent(tree, space=" ", level=0)
try:
tree.write(self.output_file, encoding='utf-8', xml_declaration=True)
print(f"✅ RSS-Feed erfolgreich erstellt: {self.output_file}")
print(f"📊 Anzahl der Episoden: {len(cloudcasts)}")
if self.extract_audio:
audio_count = sum(1 for c in cloudcasts if c.get('audio_url', '').startswith('http') and 'mixcloud.com' not in c.get('audio_url', ''))
print(f"🎵 Direkte Audio-URLs extrahiert: {audio_count}/{len(cloudcasts)}")
return True
except Exception as e:
print(f"❌ Fehler beim Schreiben der XML-Datei: {e}")
return False
def serve_feed(self, port=8000):
"""Startet einen einfachen HTTP-Server für den RSS-Feed."""
import http.server
import socketserver
import os
# Wechsle in das Verzeichnis mit der XML-Datei
os.chdir(os.path.dirname(os.path.abspath(self.output_file)))
handler = http.server.SimpleHTTPRequestHandler
try:
with socketserver.TCPServer(("", port), handler) as httpd:
print(f"🌐 Server läuft auf http://localhost:{port}")
print(f"📡 RSS-Feed: http://localhost:{port}/{os.path.basename(self.output_file)}")
print("⏹️ Drücke Ctrl+C zum Beenden")
httpd.serve_forever()
except KeyboardInterrupt:
print("\n👋 Server beendet.")
except Exception as e:
print(f"❌ Fehler beim Starten des Servers: {e}")
def main():
parser = argparse.ArgumentParser(description="Erstellt einen RSS-Feed aus Mixcloud-Tracks mit echten Audio-URLs")
parser.add_argument("username", help="Mixcloud-Benutzername (z.B. serman_dj)")
parser.add_argument("-o", "--output", default="mixcloud_feed.xml",
help="Ausgabedatei für den RSS-Feed (Standard: mixcloud_feed.xml)")
parser.add_argument("-l", "--limit", type=int, default=50,
help="Anzahl der zu holenden Tracks (Standard: 50)")
parser.add_argument("--no-audio", action="store_true",
help="Deaktiviert die Audio-URL-Extraktion (nur Mixcloud-Links)")
parser.add_argument("--serve", action="store_true",
help="Startet einen HTTP-Server für den RSS-Feed")
parser.add_argument("--port", type=int, default=8000,
help="Port für den HTTP-Server (Standard: 8000)")
args = parser.parse_args()
extract_audio = not args.no_audio
generator = MixcloudRSSGeneratorPro(args.username, args.output, extract_audio)
print(f"🎵 Erstelle RSS-Feed für Mixcloud-User: {args.username}")
if extract_audio:
print("🔧 Audio-URL-Extraktion aktiviert (kann einige Minuten dauern)")
else:
print("⚡ Schnellmodus: Nur Mixcloud-Links (keine Audio-Extraktion)")
print("-" * 60)
success = generator.create_rss_feed()
if success and args.serve:
generator.serve_feed(args.port)
if __name__ == "__main__":
main()

View File

@ -1 +1,2 @@
requests>=2.31.0
yt-dlp>=2024.1.0

56
run_generator.py Normal file
View File

@ -0,0 +1,56 @@
#!/usr/bin/env python3
"""
Optimierter Mixcloud RSS Feed Generator
Erstellt Podcast-kompatible RSS-Feeds mit direkten Audio-Links.
"""
import subprocess
import sys
import os
from pathlib import Path
def run_pro_script(*args):
"""Führt das Pro-Script mit uv run aus."""
cmd = ["uv", "run", "python", "mixcloud_rss_pro.py"] + list(args)
try:
result = subprocess.run(cmd, check=True, capture_output=True, text=True)
print(result.stdout)
return True
except subprocess.CalledProcessError as e:
print(f"❌ Fehler: {e}")
if e.stdout:
print("STDOUT:", e.stdout)
if e.stderr:
print("STDERR:", e.stderr)
return False
except FileNotFoundError:
print("❌ uv nicht gefunden. Verwende fallback...")
return False
def main():
"""Wrapper für das Pro-Script."""
if not Path("mixcloud_rss_pro.py").exists():
print("❌ mixcloud_rss_pro.py nicht gefunden!")
sys.exit(1)
# Argumente weiterleiten
args = sys.argv[1:]
print("🚀 Starte optimierten Mixcloud RSS Generator...")
print("=" * 50)
success = run_pro_script(*args)
if not success:
print("\n⚠️ Fallback: Versuche direkten Python-Aufruf...")
try:
import mixcloud_rss_pro
# Hier könntest du das Script direkt aufrufen
print("❌ Bitte verwende: uv run python mixcloud_rss_pro.py")
except ImportError as e:
print(f"❌ Import-Fehler: {e}")
print("💡 Installiere die Abhängigkeiten: uv pip install -r requirements.txt")
if __name__ == "__main__":
main()

View File

@ -16,12 +16,13 @@ def update_feed():
"""Aktualisiert den RSS-Feed."""
print("🔄 Aktualisiere RSS-Feed...")
result = subprocess.run([
sys.executable, "mixcloud_rss.py", "serman_dj",
"uv", "run", "python", "mixcloud_rss_pro.py", "serman_dj",
"--output", "mixcloud_feed.xml"
], capture_output=True, text=True)
if result.returncode == 0:
print("✅ RSS-Feed erfolgreich aktualisiert!")
print(result.stdout)
return True
else:
print(f"❌ Fehler beim Aktualisieren: {result.stderr}")
@ -64,8 +65,8 @@ def main():
print("=" * 40)
# Überprüfe ob wir im richtigen Verzeichnis sind
if not Path("mixcloud_rss.py").exists():
print("❌ mixcloud_rss.py nicht gefunden!")
if not Path("mixcloud_rss_pro.py").exists():
print("❌ mixcloud_rss_pro.py nicht gefunden!")
print(" Stelle sicher, dass du im richtigen Verzeichnis bist.")
sys.exit(1)

8
uv.lock generated Normal file
View File

@ -0,0 +1,8 @@
version = 1
revision = 2
requires-python = ">=3.11"
[[package]]
name = "rss-feeder"
version = "0.1.0"
source = { virtual = "." }