1 / 5

Unicoden Common Locale Data Repository (CLDR)

Unicoden Common Locale Data Repository (CLDR). Kotus 28.9.2004 - EIK. Unicode <www.unicode.org>. Juuret vuodelta 1986 (japanin ja kiinan merkistöongelmien ratkaisemiseksi); virallistettu 1991, jolloin myös sovittiin yhteistyöstä ISO/IEC:n UCS-standardin (10646) kanssa.

amandla
Download Presentation

Unicoden Common Locale Data Repository (CLDR)

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Unicoden Common Locale Data Repository (CLDR) Kotus 28.9.2004 - EIK

  2. Unicode <www.unicode.org> • Juuret vuodelta 1986 (japanin ja kiinan merkistöongelmien ratkaisemiseksi); virallistettu 1991, jolloin myös sovittiin yhteistyöstä ISO/IEC:n UCS-standardin (10646) kanssa. • Siinä, missä UCS-standardi keskittyy määrittelemään merkit (nimet ja koodipositiot), Unicode-standardi myös määrittelee niiden toteutuksiin vaikuttavia ominaisuuksia. • Jäseninä lähinnä merkittävät ICT-alan yritykset, Suomesta liitännäisjäsenenä Nokia, nykyisin yhteistyöjäsenenä myös Kotus (”RILF”). • Huhtikuussa 2004 Unicode-liittymän tehtäväalue laajeni myös muihin kieli- ja kulttuurisidonnaisin merkintätapoihin, joita varten perustettiin Common Locale Data Repository ja sille oma tekninen komitea.

  3. Common Locale Data Repository<http://www.unicode.org/cldr/> • Rekisteriin määritellään mm. seuraavia paikallisasetuksia: • Kielten ja maiden yms. nimet, eräitä avainsanoja • Kirjoitussuunta, merkistö, erottimet, vastaukset • Aakkostus, myös esim. erityisesti puhelinluetteloa varten • Mittajärjestelmä, päivämäärät ja kellonajat • Numeeristen suureiden esitys, valuutat • Määritykset esitetään XML-muodossa, jotta niitä voidaan haluttaessa käyttää (myös selektiivisesti) suorituspohjana; meidän kannaltamme tärkeintä on kuitenkin rekisteröidyn tietosisällön käyttö teknisestä toteutuksesta riippumatta.

  4. Common Locale Data RepositoryKotuksen rooli • Periaatteessa kuka tahansa voi toimittaa CLDR-tekniselle komitealle ns. Bug-raportteja, joiden perusteella tietoja päivitetään, mikäli niissä esitetty lähde hyväksytään. • Unicoden yhteistyöjäsenenä Kotusta kuitenkin pidetään sellaisena luotettavana tahona, joka voi tietolähteekseen nimetä tarvittaessa myös tämän kansallisen työryhmän (joten esimerkiksi rajoittuneet tai peräti vanhentuneet kansalliset standardit voidaan sivuuttaa ongelmitta). • Kotuksen tulee kuitenkin osallistua myös kehitystyöhön. • Uusi painos tietokannasta ilmestyy n. 6 kk:n välein, nyt seuraavan (V.1.2) päivitysaika päättyi 3. syyskuuta.

  5. Eräitä muita mahdollisia työkohteitaMm. näiden toteutuminen riippuu paljolti mm. OPM:n päätöksistä • Kansallisten standardien päivitys: toimistostandardit, näppäimistökaavio, lajittelu kv. standardeihin nivoutuvaksi • Kansallisten merkkien käyttö internet-osoitteissa • Väestörekisterissä yms. sallitun merkistön laajennus • Osallistuminen UCS/Unicode-merkistötyöhön (erit. UPA) • Suomen kielen taivutusmuotojen runsaasta käytöstä hakukoneille aiheutuvien tarpeiden määrittely, myös tavutussääntöjen ja oikolukualgoritmien määrittely • Translitterointikäytäntöjen selvitys ja sovellusohjeet • Sähköisen kaupan ja asioinnin monet edellytykset

More Related