Du bist nicht angemeldet.

Lieber Besucher, herzlich willkommen bei: WebStyleBoard. Falls dies dein erster Besuch auf dieser Seite ist, lies bitte die Hilfe durch. Dort wird dir die Bedienung dieser Seite näher erläutert. Darüber hinaus solltest du dich registrieren, um alle Funktionen dieser Seite nutzen zu können. Benutze das Registrierungsformular, um dich zu registrieren oder informiere dich ausführlich über den Registrierungsvorgang. Falls du dich bereits zu einem früheren Zeitpunkt registriert hast, kannst du dich hier anmelden.

1

Mittwoch, 9. März 2005, 09:39

google und *.xml

hilöchen

Mir ist gerade mal was aufgefallen und zwar
http://www.google.de/search?hl=de&c2coff…lobal.xml&meta=

dort findet man den Eintrag:
[q=google]www.webstyleboard.de/rssfeed/wsb_global.xml
Dateiformat: Unerkennbar - HTML-Version
Ähnliche Seiten [/q]

liegt das mit dem "Unerkennbar" daran das Google das Format nicht kann oder liegt der Fehler im eigenen Hause.
Signatur von »TheNobody Style«

2

Mittwoch, 9. März 2005, 10:51

RE: google und *.xml

Hi,
ich vermute, daß es an Google liegt. Du bist schließlich nicht allein, siehe allinurl:"rss.xml"
Gruß
Ingo

3

Mittwoch, 9. März 2005, 14:27

RE: google und *.xml

Keine Sorge, TNS ;) Es liegt definitiv an google. Andere Suchmaschinen verhalten sich da anderst, msn-suche spidert gar keine .xml, altavista tut so, als währen es normale dokumente.
Da kann man drüber streiten, ob Suchmaschinen .xml-Dateien spidern sollen.. Ich finde es ansich weniger sinnvoll.

4

Mittwoch, 9. März 2005, 14:45

Aber lässt sich das nicht anhand eines entsprechenden Vermerks in der robots.txt unterbinden? Wäre aber natürlich nur eine rein kosmetische Angelegenheit... ;)
Signatur von »LapisInfernalis« Eine Milde Gabe...

Der Horizont vieler Menschen ist ein Kreis mit dem Radius Null - und das nennen sie ihren Standpunkt.

Albert Einstein (1879-1955)

A common mistake people make when trying to design something completely foolproof is to underestimate the ingenuity of complete fools.
Douglas Adams (1952-2001)

5

Donnerstag, 10. März 2005, 00:48

RE: google und *.xml

Hi,

Zitat von »streifenkiste«

Da kann man drüber streiten, ob Suchmaschinen .xml-Dateien spidern sollen.. Ich finde es ansich weniger sinnvoll.

Du überrsiehst dabei, daß xml-Dateien nicht nur für RSS-Feeds genutzt werden. Ich habe schon komplette Webseiten in xml gesehen.
Gruß
Ingo

6

Donnerstag, 10. März 2005, 01:13

moeglich ist's - zukunftssicher allemal, doch heute leider noch nicht sinnvoll einsetzbar dank inkompetenz eines einzelnen herstellers der es in 3 jahren nicht schafft nen patch rauszubringen, der seiner software beibringt die xml-deklaration auch als solche anzuerkennen anstatt abzukacken.

wobei man sich hier auf xHTML beschraenken sollte - die einschraenkungen machen es erst moeglich, maschinen die logischen zusaemmenhaenge zwischen tags und ihren inhalten verarbeiten zu lassen.
Signatur von »HoRnominatoR« "setz dich hin, trink ein glas wasser und warte auf deinen feierabend"

get OPERA for free

7

Donnerstag, 10. März 2005, 13:37

RE: google und *.xml

Zitat von »Ingo«

Hi,

Zitat von »streifenkiste«

Da kann man drüber streiten, ob Suchmaschinen .xml-Dateien spidern sollen.. Ich finde es ansich weniger sinnvoll.

Du überrsiehst dabei, daß xml-Dateien nicht nur für RSS-Feeds genutzt werden. Ich habe schon komplette Webseiten in xml gesehen.

XML ist eigentlich ein Datenformat, und im Ursprünglichen Sinne nicht dafür vorgesehen, (x)html zu ersetzen. Wie soll google denn wissen was z.B. die Überschriften sind, die stärker zu bewerten sind, wo die links sind, die weiterverfolgt werden müssen, etc..?

8

Donnerstag, 10. März 2005, 14:14

RE: google und *.xml

Hi,
die Bedeutung der Tags könnte google natürlich schlecht deuten, was aber lediglich eine entsprechende Gewichtung des Inhaltes verhindert, nicht aber dessen Indizierung.
Und was die Referenzierung von Quellen betrifft: warum sollte google nicht XSL-Stylesheets oder die XPath-Syntax beigebracht werden können?
Gruß
Ingo

9

Donnerstag, 10. März 2005, 15:24

es geht ja nicht nur um google - sondern auch um die browser, wenn du von ganzen webauftritten sprichst. dem grossteil der user wird es egal sein - sie sehen die ausformatierte struktur - jedoch glaube ich, dass maschinen generell nichts mit der logik anfangen koennen - insbesondre im bezug auf barrierefreiheit, diese sind auch auf gewichtungen angewiesen. was soll ein screenreader denn als paragraph ansehen? <text>, <absatz>, <paragraph> oder <meine_letzte_fete>? dies zu beschraenken laeuft wieder auf xhtml hinaus. und das halte ich auch fuer sinnvoll. es hilft, logische struktur so zu beschraenken, dass man ein gewisses mass an logik und flexibilitaet fuer alle zugaenglich machen kann. ebenso, wie es eigene richtlinien (DTD) fuer RSS news gibt etc. fuer reine datenbestaende ist xml ausserst geeigent.
Signatur von »HoRnominatoR« "setz dich hin, trink ein glas wasser und warte auf deinen feierabend"

get OPERA for free

10

Donnerstag, 10. März 2005, 15:57

Hi,
schon klar. Aber wenn Datenbestände als xml präsentiert werden - was aus welchen Gründen auch immer vorkommt - dann sollten sie auch von Suchmaschinen erfaßt werden.
Google hat schon lange keine Probleme mit PDF, oder Word, auch Excel wird mehr oder weniger gut indiziert und sogar mit Flash wird es bereits versucht. Warum dann nicht xml?
Gruß
Ingo

11

Donnerstag, 10. März 2005, 17:29

Zitat von »HoRnominatoR«

diese sind auch auf gewichtungen angewiesen. was soll ein screenreader denn als paragraph ansehen? <text>, <absatz>, <paragraph> oder <meine_letzte_fete>? dies zu beschraenken laeuft wieder auf xhtml hinaus.

oder auf einen Einbau in Sprachen ala CSS:

Quellcode

1
2
3
ueberschrift {
 priority:high;
}


oder auf einen Zusatzeintrag in der DTD:
<!ELEMENT Ueberschrift HIGHPRIORITY>

oder so was. Es gibt so viele Möglichkeiten...
Signatur von »Alex« Man muss nichts sehen, um zu sehen, dass man nichts sieht, aber man muss etwas sehen, um zu sehen, was man nicht sieht.