Sorteerregels
Sorteerregels
In deze appendix wordt in het kort beschreven hoe de door PICA gehanteerde sortering zich verhoudt tot deel 6 van de Regels voor de Titelbeschrijving.
Algemeen
Sortering in het PICA uitvoersysteem verloopt via sorteersleutels die worden opgebouwd uit door de gebruiker aangegeven onderdelen van de titelbeschrijving.
De sorteersleutel bestaat uit:
- ofwel de kleine characterset
- ofwel de volledige characterset (Intermarc)
De ervaring leert dat sortering via de kleine characterset over het algemeen de beste resultaten geeft. De kleine characterset heeft als inhoud:
- cijfers 0-9
- letters a-z
A-Z
- leestekens alleen de spatie
- diacrieten in omgezette vorm volgens tabel 6
De volledige characterset omvat alle Intermarc tekens die door bij invoer kunnen worden gebruikt. Alle tekens worden letterlijk gesorteerd.
In het hiernavolgende overzicht wordt de PICA sortering vergeleken met RT6. Gezien het feit dat sortering via de kleine characterset het meest voorkomt, wordt deze sortering als uitgangspunt genomen in het overzicht.
VERHOUDING PICA-RT6
ad RT6 hoofdstuk 3
- in de PICA sortering wordt altijd alleen maar de met de spatiebalk ingevoerde spatie gesorteerd. Leestekens en begripsvervangende tekens (3.03) worden niet vervangen door een spatie, maar weggelaten of letterlijk meegesorteerd (alleen in de volledige characterset).
De PICA sortering kent geen leestekens met signaalfunctie.
Voorbeeld:
4000 @2- 2= 0 sorteert als: 2 2 0 4000 @1940/ 45 sorteert als: 1940 45 4000 @proces-verbaal sorteert als: procesverbaal 4000 @$3 and no more sorteert als: 3 and no more
De gegeven sortering ontstaat bij de kleine characterset.
- Opeenvolgende spaties worden niet samengetrokken en inleidende spaties worden niet weggelaten (3.06/07)
Voorbeeld:
4000 @ and so to bed 3000 H.@ Smit
- sorteren op resp. "___and..." en "_Smit" wat tot resultaat heeft dat deze titel en naam helemaal vooraan in de sortering terecht komen.
- een sorteergetal is bij PICA een cijfer of een reeks van cijfers alleen onderbroken door een spatie, niet door een leesteken (vgl. 3.08)
Voorbeeld:
4000 @13,56 en 4000 @1356
worden beide gesorteerd als "1356"
Alle getallen in Arabische cijfers worden -in hoofdtitels in de sortering automatisch aangevuld met voorloopnullen tot 8 posities totaal. Getallen van 8 of meer cijfers worden niet aangevuld. In het geval er in de hoofdtitel Romeinse cijfers voorkomen wordt kmc 3220 -mits toegevoegd - in de sortering gebruikt in plaats van kmc 4000.
ad RT6 hoofdstuk 5
- sortering van namen volgens RT6 wordt volledig gevolgd.
Men dient zich echter te realiseren dat bij sortering via de kleine characterset leestekens weggelaten worden.
Voorbeeld:
3000 B.B.@Bosch 3000 Barend@Bosch sorteert eerst Barend en dan BB
ad RT6 hoofdstuk 7
- opbouw van de sorteersleutel vindt altijd plaats vanaf het @ teken. Bij titels wordt de aan het @ teken voorafgaande tekst niet vervangen door een sorteerspatie (7.07)
- bij boekmaterialen komt de algemene materiaalaanduiding niet voor (7.08)
- het jaar van uitgave -eerste onderdeel van kenmerkcode 1100- wordt altijd gebruikt in de sorteersleutel.
Onvolledige jaartallen worden niet aangevuld (7.10)
ad RT6 hoofdstuk 8
- er is geen onderscheid in de sortering van verdubbelingen verwijzingen en hoofdcatalogustitels. Sortering verloopt altijd: (secundair hoofdwoord), primair hoofdwoord, titelgegevens (8.01)
ad RT6 hoofdstuk 9/10
bijzondere sorteergegevens worden niet gehanteerd, met uitzondering van:
- sorteercode voor Bijbels en Bijbelboeken in 321X
- taalcode en nadere informatie bij de hoofdtitel in 321X. Deze sorteergegevens vormen samen met de hoofdtitel 1 sorteergroep (9.12 en hoofdstuk 10)
- voor Bijbels en Bijbelboeken wordt een systematische en geen alfabetische sortering gehanteerd