Prijavite se u repozitorij kako biste mogli spremiti objekt u svoju listu.
Citirajte ovaj rad
Bogunović, I., Jelčić Čolakovac, J. i Borucinsky, M. (2022). Baza engleskih riječi i hrvatskih istovrijednica [Skup podataka]. https://urn.nsk.hr/urn:nbn:hr:187:891063.
Bogunović, Irena, et al. Baza engleskih riječi i hrvatskih istovrijednica. Pomorski fakultet, 2022. 29.11.2024. https://urn.nsk.hr/urn:nbn:hr:187:891063.
Bogunović, Irena, Jasmina Jelčić Čolakovac, i Mirjana Borucinsky. 2022. Baza engleskih riječi i hrvatskih istovrijednica. Pomorski fakultet. https://urn.nsk.hr/urn:nbn:hr:187:891063.
Bogunović, I., Jelčić Čolakovac, J. i Borucinsky, M. 2022. Baza engleskih riječi i hrvatskih istovrijednica. Pomorski fakultet. [Online]. [Citirano 29.11.2024.]. Preuzeto s: https://urn.nsk.hr/urn:nbn:hr:187:891063.
Bogunović I, Jelčić Čolakovac J, Borucinsky M. Baza engleskih riječi i hrvatskih istovrijednica. [Internet]. Pomorski fakultet; 2022, [pristupljeno 29.11.2024.] Dostupno na: https://urn.nsk.hr/urn:nbn:hr:187:891063.
I. Bogunović, J. Jelčić Čolakovac i M. Borucinsky, Baza engleskih riječi i hrvatskih istovrijednica, Pomorski fakultet, 2022. Citirano: 29.11.2024. Dostupno na: https://urn.nsk.hr/urn:nbn:hr:187:891063.
Naslov (hrvatski)
Baza engleskih riječi i hrvatskih istovrijednica
Naslov (engleski)
The database of English words and their Croatian equivalents
Ova baza sadrži engleske riječi koje se u hrvatskome pojavljuju u svom izvornom obliku, zadržavajući ortografska obilježja engleskog jezika (npr. show, boxer, zombie, skin, itd.). Popis engleskih riječi temelji se na Bazi engleskih riječi u hrvatskome (Bogunović i Kučić 2022, https://repository.pfri.uniri.hr/islandora/object/pfri%3A2495) te je dodatno nadopunjen riječima dobivenim pretragom korpusa hrWaC (Ljubešić i Erjavec 2011; Ljubešić i Klubička, 2014) pomoću platforme SketchEngine (Kilgarriff i sur. 2004). Ista platforma poslužila je za dodatnu provjeru konačnog popisa engleskih riječi koristeći se konkordancijama I programskim jezikom CQL. Engleski je kontekst uklonjen pomoću Xf taggera, kako bi se ta pojavnost isključila iz konačnih podataka. Podaci su dodatno ručno provučeni kroz korpuse ENGRI (Bogunović i sur., 2021; Bogunović i Kučić, 2021) i hrWaC korpisteći alate slučajnog uzorka i filtriranja kako bi se uklonile riječi koje sadrže npr. imena, lažne kognate, lažne parove, itd. Za svaku riječ dostupna je i hrvatska istovrijednica, ako ista postoji za navedenu englesku riječ, kao i podatak o čestoti pojavljivanja u spomenutim korpusima. Odabir hrvatske istovrijednice temelji se na korpusnim podacima o pojavnosti riječi te dostupnim mrežnim rječnicima hrvatskog jezika. Nadalje, jednorječni i višerječni engleski izrazi prikazani su zasebno radi preglednosti same baze te pojednostavljivanja pretraživanja.
Važno je istaknuti kako ova baza ne sadrži konačne podatke o pojavnosti engleskih riječi u hrvatskom, ali je svakako reprezentativna te ukazuje na trenutni položaj engleskih riječi u hrvatskom jeziku. U planu je postojeću bazu nadopuniti i osuvremeniti novijim tekstovima i podacima.
Sažetak (engleski)
The current database contains English words which appear in Croatian in their original, unadapted form (e.g. show, boxer, zombie, skin, etc.). The list of words is based on The Database of English words in Croatian (Bogunović & Kučić 2022; https://repository.pfri.uniri.hr/islandora/object/pfri%3A2495), and was further complemented with words obtained from the corpus hrWaC (Ljubešić & Erjavec 2011; Ljubešić & Klubička 2014) using the platform SketchEngine (Kilgarriff et al. 2004). The same platform was used to check the list of English words against the corpora ENGRI (Bogunović et al. 2021; Bogunović & Kučić 2021) i hrWaC by consulting concordances and using CQL. The tagger Xf was used to filter out all English sentences embedded in Croatian texts. Corpus results were then manually checked using the random sample and filter tools to remove e.g., proper nouns, false cognate, false pairs, etc. The database also lists Croatian equivalents (and corresponding frequencies in the corpora) for each English word if they exist in Croatian. The choice of the Croatian equivalent depended greatly on the available corpus data on word frequency as well as Croatian online dictionaries. Furthermore, single-word and multi-word English expressions are represented separately in the database for reasons of visual transparency and simplification of word search.
We would like to stress that the database by no means represents a final product and is not a definite representation of data on English words in Croatian, but is, however, representative of their current status in the Croatian language. Further efforts will be made to update the database and incorporate new data.
Šifra: UIP-2019-04-1576 Naziv (hrvatski): Engleske riječi u hrvatskome jeziku: Identifikacija, afektivno-semantičko normiranje i ispitivanje kognitivne obrade bihevioralnim i neuroznanstvenim metodama Kratica: ENGRI Voditelj: Irena Bogunović Pravna nadležnost: Hrvatska Financijer: HRZZ Linija financiranja: UIP
Izdavač
Pomorski fakultet Faculty of Maritime Studies, Rijeka