Bronies.de
DeviantArt: Beschreibung eines Bildes oder ähnliches aus Quellcode extrahieren? - Druckversion

+- Bronies.de (https://www.bronies.de)
+-- Forum: Off-Topic (https://www.bronies.de/forumdisplay.php?fid=11)
+--- Forum: Internet & Technik (https://www.bronies.de/forumdisplay.php?fid=54)
+--- Thema: DeviantArt: Beschreibung eines Bildes oder ähnliches aus Quellcode extrahieren? (/showthread.php?tid=9123)



DeviantArt: Beschreibung eines Bildes oder ähnliches aus Quellcode extrahieren? - Flying-Claw - 03.01.2013, 11:54

Guten Morgen!

Hat jemand eine Idee, wie man die Beschreibung eines Bildes oder ähnliches extrahieren könnte? (Quellcode natürlich vorhanden)
Es bei
"<meta name=\"description\" content=\""
zu splittenwird nicht funktionieren, da nach diesem Tag anscheinend nicht immer die Beschreibung folgt. Dazu steht gar nicht mal die ganze Beschreibung darin steht -.-

MfG


RE: DeviantArt: Beschreibung eines Bildes oder ähnliches aus Quellcode extrahieren? - 404compliant - 04.01.2013, 03:39

Es gibt in den Seiten ein <div id="artist-comments" class="">, das scheint alles wesentliche zu beinhalten. Allerdings beinhaltet das auch die Titelzeile der Beschreibung. Wenn du nur an dem Text interessiert bist, musst du darin nach dem <div class="text-ctrl"> bzw. dem wiederum darin enthaltenen <div class="text block"> suchen. In dem Beispiel, das ich mir angeschaut hab, gab es im text-ctrl genau ein text block, hab aber keine Ahnung, ob das immer so ist.

Ist jedenfalls ein Job für einen ausgewachsenen HTML-Parser, bei den vielen verschachtelten div's kommt man sonst nicht weit.

Achtung: DA ist sehr Ajax-Lastig, Seiten im Browser sind mit JS eventuell ganz anders aufgebaut, als direkt geladene Seiten. Die statischen Seiten scheinen aber alle Inhalte zu enthalten.


RE: DeviantArt: Beschreibung eines Bildes oder ähnliches aus Quellcode extrahieren? - Flying-Claw - 04.01.2013, 20:47

@404compliant Vielen Dank Pinkie happy! Ich probiers mal aus RD wink!


RE: DeviantArt: Beschreibung eines Bildes oder ähnliches aus Quellcode extrahieren? - Flying-Claw - 08.01.2013, 13:41

Soo, nach längerer Zeit wieder kurz dran gesetzt - Funktioniert. Nur noch einen HTML to BBCode Parser bauen, und alles geht RD laugh!