|
|
ScidBase |
|
|||||||||||||||||||||||||||||||||||||
|
|||||||||||||||||||||||||||||||||||||||
|
Merkmale von ScidBaseHier sind einige Statistiken vom 29 Jan 2004 über ScidBase.
ScidBase ist das Ergebnis vieler Hunderter von Arbeitsstunden...
Was ist drin, was ist draußenViele im Internet verfügbare Partien (von ausreichend starken Spielern unter ernsthaften Bedingungen bei ernsthafter Zeitkontrolle gespielt) sind einfach nicht "stark" genug für eine Datenbank wie ScidBase. Einige Blitzpartien sind schön (so wie die Stichkämpfe für eine ernsthafte Meisterschaft), aber zuviele reduzieren die Qualität des dargebotenen Schachs. Die meisten historischen Partien sind enthalten, aber viel Seltsames sowie Schaupartien wurden außen vor gelassen. Ich mache mir wirklich nichts daraus, wie oft Morphy Patzer geschlagen hat. Für Turniere in der modernen Zeit ist die Faustregel, daß ein Turnier wenigstens einige starke Titelträger haben sollte und nicht zu viele vollständig unbekannte Spieler. Es gibt verhältnismäßig wenige Partien Computer gegen Computer, außer für so wichtige Ereignisse wie organisierte Meisterschaften. Partien "Computer-Computer" können leicht erzeugt werden, aber sie tendieren dazu, in einer allgemeinen Datenbank die Informationen über Eröffnungen zu verfälschen. Fernschachpartien sind ebenfalls hauptsächlich auf Weltmeisterschaften und ähnliches beschränkt, da die Qualität im Fernschach stark schwankt. Eine gute Daumenregel für die jüngeren Jahre: wenn es für TWIC (The Week in Chess) gut genug ist, dann ist es auch gut genug für ScidBase. Es ist schwierig, eine feste Regel zu setzen, weil sogar Jugendturniere wie die nationalen oder regionalen Meisterschaften der unter zwölf- oder zehnjährigen heutzutage starke Titelträger haben können. Eine Grauzone bilden große Schweizer Turniere, die einige Großmeister, IMs usw., aber ebenso auch viele schwache Spieler haben. ScidBase beinhaltet allgemein alle bekannten Partien solcher Turniere unter Vermeidung einer "Zensur", die auf Ratingzahlen beruht, obwohl in vielen Fällen überhaupt nur die Partien verfügbar sind, in denen wenigstens ein "starker" Spieler beteiligt war. Die meisten Datenbanken enthalten viele "leere" Partien (mit keinen oder nur sehr wenigen Zügen, die üblicherweise mit 1. a4 oder 1. h4 beginnen). Diese wurden nur zurückbehalten, um Kreuztabellen zu vervollständigen, und sind einfach genug, um sie mit einer Partiedatensuche in Scid zu beseitigen, falls Sie das so wollen. Leere Partien in Turnieren, wo bereits viele Partien fehlen, sind in der Regel gelöscht worden. NamenskonventionEines der wichtigsten Merkmale einer gut bereinigten Datenbank (abgesehen davon, daß sie sehr wenige Dubletten hat) ist eine einheitliche, standardisierte Bezeichnung von Spielern, Turnieren und Spielorten. Hier ist eine kurze Erklärung von einigen der in ScidBase verwendeten Namenskonventionen. SpielernamenIn den meisten Fällen werden volle Namen (so, wie sie in der letzten Ratingliste der FIDE auftauchen) verwendet. Wenn ein Spieler mehr als einen bekannten Rufnamen hat, werden der zweite und die folgenden Rufnamen in der Regel mit den Anfangsbuchstaben abgekürzt. Wo immer möglich haben alle Partien eines Spielers den gleichen Namen für diesen Spieler gemeinsam. Ungenügende Namensinformation macht dies oft unmöglich, und es gibt in der Datenbank noch einige mehrdeutig abgekürzte Namen. Ländercodes werden ignoriert, außer um kollidierende Namen eindeutig zu machen. Dies ist für die Ära der Nach-UdSSR wichtig, wo viele Spieler mehr als ein Land vertreten haben. Titel (GM/IM/FM usw.) wurden ebenso gelöscht (da sie oft ohnehin falsch sind) wie Zusätze über Verein und Region. Sie mögen bei einer Sammlung, die Bundesligapartien gewidmet ist, wissen wollen, wer für Solingen spielte, aber hier handelt es sich hier um eine allgemeine Datenbank. Spieler, die eine Namensänderung hatten (in der Regel Frauen, die geheiratet haben), haben den aktuellen Namen nachträglich erhalten. Dies mag ein wenig verwirrend sein, vermeidet aber einen Spieler unter zwei verschiedenen Namen und die Notwendigkeit zu entscheiden, wann sich der Name tatsächlich geändert hat. DatumsangabenWo immer möglich, wird das volle Datum (z.B. 2003.12.31) verwendet. Falls nur der Monat, in dem ein Turnier begann, bekannt ist, wird dieser für alle Partien dieses Turniers verwendet: "1998.04" zum Beispiel, selbst wenn einige Partien im Mai gespielt wurden. Eine strenge feste Regel ist, daß jede Partie, die als zu einem Turnier gehörend betrachtet wird, das gleiche Turnierdatum haben muß (was soviel wie die Information über das bekannte Datum der ersten Partie ist). Dies ist für die Zuordnung von Partien zu Turnieren wichtig. OrtsnamenBeinahe alle Ortsangaben enden mit einem Ländercode aus drei Buchstaben. Die gängige englische Schreibweiswe für Städtenamen wird allgemein verwendet. Ortsangaben, wo nur das Land bekannt ist, haben nur den Ländercode, z.B. "FRA" (dies wird für Mannschaftsmeisterschaften, die in mehreren Städten über mehrere Monate hinweg stattfinden können, am häufigsten angewendet). Wo ein Ort das Land wechselte (z.B. GER/FRG/GDR, Jugoslawien und die ehemaligen Sowjetrepubliken), wird das gegenwärtige Land verwendet. Es ist "Kiev UKR" (Ukraine), selbst wenn dort die Meisterschaft der UdSSR gespielt wurde. Turniere, die an mehreren Orten gespielt wurden, haben in der Regel einen einheitlichen Ortsnamen, so wie"London ENG / Leningrad RUS" für die Weltmeisterschaft 1986. Diese Regel wird bei lange laufenden Ereignissen weniger klar befolgt. So kann eine nationale Mannschaftsmeisterschaft sinnvoll als ein einziges Ereignis (in welchem Fall es eine einheitliche Ortsangabe haben sollte) oder als mehrere einzelne Ereignisse gedeutet werden. Internetpartien haben den Ländercode "INT", z.B. "Internet Chess Club INT" oder einfach die Gattung "Internet INT". Fernschachpartien haben einen Ort "Corr", der möglicherweise von einem Ländercode gefolgt wird, wenn sie innerhalb einer Nation gespielt wurden. Namen von VeranstaltungenDie Vereinheitlichung von Veranstaltungsnamen ist wahrscheinlich der schwierigste Teil einer Datenbankbereinigung. Es gibt so viele mehrdeutige Konventionen und Abkürzungen. Für ScidBase habe ich versucht, ein einigermaßen ausführliches Standardformat zu erzeugen und wende es so konsequent wie möglich an, um noch Veranstaltungsnamen in lesbarem Englisch zu haben. Hier sind ein paar der aufgetretenen Probleme:
Die Konventionen von Veranstaltungsnamen in ScidBase beinhalten:
ZusammenfassungWie Sie sehen, machte ScidBase viel Arbeit. Ich hoffe, Sie unterstützen sie, indem Sie gegen eine Spende eine Kopie hiervon auf CD-ROM beziehen. |
||||||||||||||||||||||||||||||||||||||
|
Scid SF Index Page |
Seite aktualisiert: 29 Jan 2004 |