1 / 13

Hány szó van a magyarban?

Hány szó van a magyarban?. Nagy Viktor nagyv@nytud.hu MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Magyar tudomány napja, 2003. 11. 04. Mi a szó?. Hol vannak a szó határai a szövegben? nyitva tartás , de nyitvatartási Hogyan kezeljük a ragozott szavakat?

antione
Download Presentation

Hány szó van a magyarban?

An Image/Link below is provided (as is) to download presentation Download Policy: Content on the Website is provided to you AS IS for your information and personal use and may not be sold / licensed / shared on other websites without getting consent from its author. Content is provided to you AS IS for your information and personal use only. Download presentation by click this link. While downloading, if for some reason you are not able to download a presentation, the publisher may have deleted the file from their server. During download, if you can't get a presentation, the file might be deleted by the publisher.

E N D

Presentation Transcript


  1. Hány szó van a magyarban? Nagy Viktor nagyv@nytud.hu MTA Nyelvtudományi Intézet Korpusznyelvészeti Osztály Magyar tudomány napja, 2003. 11. 04.

  2. Mi a szó? • Hol vannak a szó határai a szövegben? • nyitva tartás, de nyitvatartási • Hogyan kezeljük a ragozott szavakat? • embert, emberekkel, embereimmel… • Hogyan kezeljük a képzett szavakat? • emberes, emberesedik, emberség, emberiség... • Két szó-e a költ a pénzt költ és a verset költ környezetben? • Külön szó-e a vakarózik és a vakaródzik?

  3. Hány szó van a szövegben? „Száll a madár ágról ágra Száll az ének szájról szájra”

  4. Hány szó van a szövegben?Szóelőfordulások „[1]Száll [2]a [3]madár [4]ágról [5]ágra [6]Száll [7]az [8]ének [9]szájról [10]szájra”

  5. Hány szó van a szövegben?Szóalakok „[1]Száll [2]a [3]madár [4]ágról [5]ágra Száll[6]az [7]ének [8]szájról [9]szájra”

  6. Hány szó van a szövegben?Szótári szók „[1]Száll [2]a [3]madár [4]ágról ágra Száll[5]az [6]ének [7]szájról szájra”

  7. További problémák • Mi számít egy adott nyelv szavának? • Ismeret vagy használat? • Köznyelven kívüli területek (tudományos, szleng stb.)? • Idegen szavak? • Elavult szavak? • Számnevek… (végtelen sok?) • Milyen módszerrel számoljuk meg a nyelv szavait?

  8. Szótárak

  9. Számlálás korpusszal • A korpusz a nyelvhasználat mintája • Magyar Nemzeti Szövegtár – az írott nyelv korpusza • Mérete: 150 millió szövegszó • Kb. 1 700 000 szótári szót tartalmaz • ááááááááá is benne van • Kb. 250 000 szótári szó legalább ötször • zúzapörkölt kimarad

  10. A szószám növekedése a minta növelésével • A tapasztalat szerint nincs felső korlát. • Potenciálisan végtelen sok szó van

  11. Hogyan lehetséges ez? • Új szavak korlát nélkül keletkezhetnek. • Produktív szóalkotási műveletek • Szóképzés: rozsda+ság → rozsdaság • Összetétel: váll + vonal → vállvonal • Elvonás: gépírás, gépíró → gépír • Kölcsönzés: mikrocsip, büdzsé • Régi alak új jelentést kap: egér, akció • …

  12. olvasás olvasási olvasásilag olvasat olvasati olvasatlan olvasatlanul olvasatú olvasgat olvasgatás olvashatatlan olvashatatlanság olvashatatlanul … olvasásértés olvasás-írás olvasáskészség olvasáskultúra olvasáskutató olvasásmód olvasásoktatás olvasás-szövegértés olvasástanítás olvasástanulás olvasástudás olvasászavar olvasásszociológia … olvas-ból alkotott szavak az MNSZ-ben

  13. Konklúzió • A produktív szóalkotás miatt a szókincs potenciálisan végtelen. • A szóalkotás folytonosan zajlik, lehetetlen maradéktalanul összegyűjteni az új szavakat. • A nyelv szavainak száma ezért nem meghatározható.

More Related