![]() |
Mathematisches Institut
Publizieren im Internet mit META-Informationen |
Uni Bayreuth > Mathematisches Institut > Informationen > META-Informationen |
|
|
Was sind META-Tags?Mit META-Tag ist der HTML-Steuerbefehl <META> gemeint. META-Tags stehen immer zwischen <HEAD> und </HEAD> im Kopf der HTML-Datei und können zwei Funktionen haben:
<HTML>   <HEAD>   ...     <META NAME="keywords" CONTENT="Kaffee, Kuchen, Limonade">     <META NAME="author" CONTENT="Tobias Langhammer">   ...   </HEAD> <BODY> (siehe auch ![]() Wie von HTML gewohnt ist die Groß- und Kleinschreibung der META-Tags und deren Attribute beliebig, sie sollte aber aus Gründen der Konvertierbarkeit einheitlich sein.
Aufbau eines META-TagsDer HTML 4.0 Standard beschreibt lediglich den grundsätzlichen Aufbau eines META-Tags, die META-Angaben sind aber nicht standardisiert.Die wichtigsten Attribute sind:
Beispiel für eine Suchmaschinen-Information:<META NAME="keywords" CONTENT="Kaffee, Kuchen, Limonade">Angabe von Schlüsselwörtern, die den Inhalt beschreiben und von Robots ausgelesen werden können. Im Inhalt des CONTENT-Attributs können auch Zeilenumbrüche vorkommen. Es muß jedoch damit gerechet werden, daß diese bei der Auswertung ignoriert werden. Beispiel für eine Browser-Anweisung:<META HTTP-EQUIV="refresh" CONTENT="5; http://www.uni-bayreuth.de"> Nach 5 Sekunden automatischer Aufruf der neuen Adresse "http://www.uni-bayreuth.de".
Welche Suchmaschinen lesen META-Angaben?Einen vollständigen Test der meistbenutzten Suchmaschinen im Internet findet man unter http://searchenginewatch.internet.com/webmasters/features.html. Welche von diesen META-Informationen ausliest, zeigt die folgende Tabelle.
Einige Suchanbieter haben sich entschlossen, keine META-Tags auszulesen. Der Grund ist der häufige Mißbrauch. So meinen einige, ihre Hompage in den Suchdiensten nach oben pushen zu können, wenn sie ein Mammutaufgebot irgendwo aufgeschnappter META-Angaben verwenden. Altavista (http://www.altavista.digital.com) und Infoseek (http://www.infoseek.com):Es werden folgende Tags erkannt:<META NAME="description" CONTENT="We specialize in grooming pink poodles."> <META NAME="keywords" CONTENT="pet grooming, Palo Alto, dog"> (vgl. http://altavista.digital.com/av/content/addurl_meta.htm und http://www.infoseek.com/Help?pg=meta_tag.html&sv=IS&lk=noframes). Existieren keine META-Tags, werden die ersten Zeilen des Dokuments gelesen. Bei Frames sollten die META-Tags in der Datei sein, die den <FRAMESET>-Tag beinhaltet. Ein <NOFRAMES>-Block kann den Inhalt zusätzlich beschreiben. Excite (http://www.excite.com) und Lycos (http://www.lycos.com):Der Robot liest ...
Excite prüft zusätzlich, ob eine Datei namens "robots.txt" vorhanden ist. Diese kann Robots den Zutritt auf Seiten verweigern. Sinnvoll kann das sein, wenn die Site noch im Aufbau ist und noch nicht offiziell abrufbar sein soll. Der Inhalt von "robots.txt" ist im Robots Exclution Standard festgelegt (http://info.webcrawler.com/mak/projects/robots/norobots.html). HotBot (http://www.hotbot.com)HotBot unterstützt nur das META-Tag keywords und sucht sonst im wesentlichen im Titel und im Dokument (vgl. http://www.hotbot.com/help/questions/question2.asp).Fireball (http://www.fireball.de):Fireball unterstützt die META-Tagsaudience, author, copyright, description, expires, keywords, page-topic, page-type, publisher und robotssowie die analogen Dublin Core-Elemente DC.Creator, DC.Contributor, DC.Description, DC.Subject und DC.Publisher(vgl. http://www.fireball.de/meta_daten.html ). ht://Dig (http://btr0xw.rz.uni-bayreuth.de/htdig/search.html):ht://Dig läuft als lokale Suchmaschine im Netz der Universität Bayreuth. Siehe auch Abschnitt![]()
META-Angaben nach dem Dublin Core-StandardDublin-Core (DC) ist ein zum Teil noch in Entwicklung steckendes Projekt, das META-Informationen strukturieren und standardisieren will (siehe http://purl.org/metadata/dublin_core). Von Interesse ist dies für Veröffentlichungen im Math-Net, da das Math-Net auf das "Subject Classification Scheme" mittels Dublin Core-Elementen aufbaut (siehe auch![]() Leider lesen zur Zeit noch die wenigsten Suchmaschinen (außer den Suchmaschinen des Math-Net) DC-Informationen aus. Die META-Angabe nach Dublin Core ist mit den Initialen "DC." gekennzeichnet. Groß- und Kleinschreibung sind in HTML zwar unerheblich, sollten aber in Hinblick auf Konvertierbarkeit eingehalten werden. Jedes Element ist optional und wiederholbar. META-Daten in DC können in beliebiger Reihenfolge stehen. Die META-Daten zerfallen in drei Gruppen:
Beschreibung:Title: Beispiel:<HEAD>
META-Angaben für das Math-NetUm Veröffentlichungen im Math-Net von Indexierungs- und Suchwerkzeugen auslesbar zu machen wird zur Zeit ein META-Standard erarbeitet, der sich streng an Dublin-Core orientiert.Zur Klassifizierung von WWW-Seiten auf Servern Mathematischer Institutionen dient das Subject Classification Scheme. Für bestimmte Dokumenttypen wurden bereits META-Daten zur genaueren Beschreibung festgelegt. (http://elib.zib.de/math-net/metadata.html) Beispiel: die Angabe der MSC-Klassifikation:Primäre MSC-Klassifikation(en) der Arbeit: <META NAME="DC.Subject.MscPrimary" CONTENT="(SCHEME=msc91) 35Q40"> Sekundäre MSC-Klassifikation(en) der Arbeit: <META NAME="DC.Subject.MscSecondary" CONTENT="(SCHEME=msc91) 35Q15"> Wird als Vereinigung von MscPrimary und MscSecondary gesetzt: <META NAME="DC.Subject.Msc" CONTENT="(SCHEME=msc91) 35Q99">
META-Angaben für ht://Dight://Dig ist ein Such-Roboter für kleine Domains und Intranetze. Da ht://Dig für die lokale Suche im WWW der Universität Bayreuth verwendet wird, sind die von ihm ausgelesenen META-Informationen von besonderem Interesse. Eine genaue Beschreibung finden Sie unter http://www.htdig.org/meta.htmlFolgende META-Tags werden von ht://Dig erkannt:
Beispiel:<HTML>
Anweisungen für Robots:Anweisungen als META-Tags:Seite soll nicht ausgewertet werden:<META NAME="robots" CONTENT="noindex"> Seite soll ausgewertet werden: <META NAME="robots" CONTENT="index"> Links der Seite sollen nicht weiter verfolgt werden: <META NAME="robots" CONTENT="nofollow"> Links der Seite sollen verfolgt werden: <META NAME="robots" CONTENT="follow"> Anweisungen in robots.txt:(siehe auch http://info.webcrawler.com/mak/projects/robots/norobots.html)Durch Anweisungen in der Datei "robots.txt" kann das Auslesen von Verzeichnissen und Dateien durch Robots verhindert werden. Es gibt zwei Anweisungen: Beschränken für bestimmte Robots:
Welche META-Angaben soll ich verwenden?Die nun folgenden META-Daten entsprechen keinem Standard, werden aber im Internet sehr häufig verwendet.Beschreibung, Author, Stichwörter:
Hier einige Beispiele: <HEAD>Bemerkung: Umlaute, Sonderzeichen,... sollten maskiert werden. (z.B. " für ") Sprachen:mit dem Attribut LANG kann man bei mehreren keywords-Angaben die Sprache unterscheiden.<META NAME="keywords" LANG="de" CONTENT="Ferien, Griechenland, Sonnenschein"> Verwendet werden die Sprachkürzel nach RFC 1766. z.B.: de deutsch
META-Tags als Browser-AnweisungMIME-Type Angabe:MIME-Typ-Bezeichnungen sind ein Internetstandard zur Kennzeichnung eines Dateityps. Sie bestehen aus den Teilen "Kategorie/Unterkategorie".Wie man explizit einen MIME-Type angeben kann, sieht man am folgenden Beispiel. Wichtig ist die Angabe des Zeichensatzes hinter "text/html", wenn im Dokument die Umlaute nicht maskiert sind. (siehe auch ![]() Beispiel:<HEAD> Datei von Originaladresse ladenDamit eine Datei nicht aus dem Browser-Cache, sondern von der Original-URL geladen wird, kann folgender META-Tag verwendet werden:<HEAD>Um einen definitiven Zeitpunkt anzugeben, an dem die Seite zu aktualisieren ist, kann man die Zeit gemäß dem folgenden Beispiel angeben: CONTENT="Sat, 14 Dec 1998 12:00:00 GMT" Automatisches Weiterleiten zu einer anderen Adresse (forwarding)Im folgenden Beispiel gibt die 5 die Anzahl der Sekunden an, die bis zum Weiterleiten vergehen soll.<HEAD> META-Angaben in einer Profil-DateiBeispiel:<HEAD PROFILE="http://meine.org/profil.rdf">In der Profil-Datei "profil.rdf" können weitere META-Informationen abgelegt werden. Noch gibt es keinen Standard, wie das aussehen soll.
Diverse andere META-InformationenSprache des Dateiinhalts:Beispiel:<META HTTP-EQUIV="content-language" CONTENT="de"> Angabe des HTML-EditorsBeispiel:<META NAME="generator" CONTENT="MS Frontpage 2.0"> Anweisung an den Netscape-Browser: nicht den normalen lokalen Browser-Cache benutzen, sondern den angegebenen externen CacheBeispiel:<META HTTP-EQUIV="ext-cache" CONTENT="name=/some/path/index.db; instructions=user instructions"> Cookie setzen (Netscape)Beispiel:<META HTTP-EQUIV="set-cookie" CONTENT="cookievalue=xxx;expires=friday, 31-dec-99 23:59:59 gmt; path=/;"> Anweisung an den Proxy-Agenten: Datei bitte nicht auf Proxy-Server speichern!Beispiel:<META HTTP-EQUIV="pragma" CONTENT="no-cache"> An Such-Robot: Bitte nach 20 Tagen erneut vorbeikommen und Datei neu auslesen!Beispiel:<META NAME="revisit-after" CONTENT="20 days">
Externe Informationen zu META-TagsHier finden Sie eine Übersicht der wichtigsten Seiten zum Thema META-Informationen im InternetSuchmaschinen
META-Tag AnleitungenDublin CoreMath-NetRequest For Comments (RFC)
Sonstiges
|
©