January 3, 2023

За проектот „Ракописи стари 500 години од Институтот за македонски јазик“

 Последните неколку дена во македонските медиуми се шират информации за тоа како „Ракописи стари 500 години од Институтот за македонски јазик со дигитализација се спасени од пожар и вода“. Станува збор за проект на Министерството за култура и Фондот за иновации и технолошки развој (ФИТР), кој го изработи фирмата „Инбокс“. Изјавата за овој проект во сите медиуми беше скоро иста со мали разлики, што значи дека сигурно била напишана од вработени во Институтот и во фирмата Инбокс и дистрибуирана по медиумите. На сајтот на Институт за македонски јазик нема информации поврзани со овој проект. Најновата изјава во Актуелности на сајтот е од 20/10/2020. Овде би сакал да објаснам за што точно се работи, и моите мислења во врска со вредноста на овој проект. 

Во овој проект потрошени се 5.000.000 денари, или 82.000 евра.

Да почнеме со насловот „Ракописи стари 500 години...“. Овој проект нема никаква врска со никакви ракописи, камоли ракописи стари 500 години, него се работи за дигитализација и преснимување на микрофилм на картотеки со јазични записи. Проектот е многу добро и детално објаснет во весникот „Сакам да кажам“. Картотеката е обична кутија полна со картички со впишани податоци за некој збор. Еве еден пример од таква картичка кај ИМЈ. 

На картичката е напишан зборот и податоци за изворот. Почнувајќи некаде од 50-ите години во претходниот век, пред да има компјутери, вработени во Институтот пишувале на вакви картички со машини за печатење, и на крај биле собрани околу 5 милиони такви картички. Овие картички обично им служат на вработените за пишување на речници. Во овој проект секоја картичка е дигитализирана и зачувана во pdf формат, а истовремено и преснимена на микрофилм.

Директорот  Јорданчо Митровски од „Инбокс“ објаснува: „...микрофилмот како стандард постои повеќе од 50 години, тој трае и до 500 години. За читање на микрофилмот потребно е само лупа и е тежок за уништување. Тој вид на материјал го создадовме за да има копија во секое време. Од друга страна пак, тој не е оперативен, не може да се користи во секојдневна употреба, единствено што може да се запали или да се изгребе. Затоа и предложивме, согласно најновите технологии што се достапни на пазарот, да се направат дигитални оригинали.“ Прашање е дали микрофилмот трае до 500 години. Микрофилмот е обична пластика која со време многу лесно се распаѓа, не верувам дека во сегашно време тој е стандард, и не верувам дека по 500 години ќе е можно да се најди и читач за микрофилм. Мое лично мислење е дека самата хартиена форма на картичката би била подолготрајна и многу полесна за читање, така да подобро би било да се најди начин да се зачуваат самите хартиени картички во безбедно место, него да се преснимуваат на микрофилм.

Сега во врска со дигиталната форма. Тука се работи за медиум, самата картичка, и податокот впишан во медиумот-картичката. Во овој проект вработените во ИМЈ и во Инбокс одлучиле да се фокусираат во зачувување на медиумот, али за лингвистички истражувања вредноста не е во самиот медиум, него во податокот впишан во медиумот, истовремено да има лесен пристап до тој податок од било кого од било каде. Од Инбокс објаснуваат: „Благодарение на проектот за дигитализација на картотеките на Институтот, документите веќе нема да се чуваат во кутии и во плакари. Вработените и научниците нема да имаат потреба рачно да ги листаат картотеките, туку ќе си ги симнуваат од компјутерски фолдери.“ Значи, секоја картичка е дигитализирана во pdf формат, а главниот збор е истовремено и називот на фајлот, или датотеката. Претпоставувам дека секој фајл е внесен во фолдер по азбучен ред. Например, сите зборови што почнуваат со буквата „д“ се во фолдерот „Д“. Така, ако некој вработен во ИМЈ сака да го бара зборот „дренка“ ќе треба да оди во некоја канцеларија во ИМЈ каде е ставен компјутерот со овие податоци, да го отвори фолдерот „Д“ и да ги прелисти сите фајлови да види дали случајно го има овој збор. А не ни значи дека го има, ако некој пред 50 години не го напишал на картичка. Сметајќи дека овој проект е наменет ексклузивно за употреба на вработените во ИМЈ, истиот нема да биде лесно достапен за лингвисти надвор од ИМЈ. Освен пребарување на зборови по азбучен ред низ фолдери, овој начин на складирање не дозволува пребарување во самите податоци за одреден збор. Например, како некој збор се употребувал во текстови пишувани во одреден временски период. 

Пред околу 20 години јас правев истражувања во ИМЈ, и тогаш им предложив друг начин на зачувување на датотеките. Како пример ги скенирав во pdf формат сите картички со зборови што почнуваат со буквата „Ш“. Потоа секоја скенирана картичка беше ставена во база за податоци Microsoft Access со метаподатоци за многу полесно пребарување. Следно требаше базата да биде префрлена на сервер за пребарување, али тогаш беше крај на мојот престој во ИМЈ. Од ИМЈ немаше иницијатива за продолжување на проектот. Во денешно време, следејќи ги сите иновации во компјутерната лингвистика, и тој начин е веќе застарен. Исто така, зборовите собрани во картотеката со зборови од македонскиот јазик имаат многу мала, или минимална вредност за изучување на македонскиот јазик од неколку причини. Прво, тие се собрани од текстови од пред неколку децении и не ја рефлектираат сегашната реалност на јазикот. Второ, количината на зборови е навистина многу мала за детални лингвистички истражувања. Почетен корпус на текстови треба да се состои од околу 100 милиони зборови, и со надградување да дојди до околу 500 милиони зборови. Трето, многу од изворните текстови во картотеката во ИМЈ се преводи од странска литература.

Што значи постоењето на корпусот за еден научник што се занимава со jазични истражувања? Корпусот на еден jазик претставува збирка од различни видови текстови и jазични материjали дадени во електронска форма. Богатството на корпусот се огледа во броjноста на материjалите од различни функционални стилови и застапеноста на сите функционални стилови. Денес, корпусот служи како поjдовна точка на секое лингвистичко истражување. Факт е дека македонскиот jазик нема ваков корпус во коj би биле вградени репрезентативни текстови на историски и на современ план во електронска форма. Нивното вградување во еден jазичен корпус ќе значи можност за повеќенаменски истражувања. Редко која држава во светот да нема свој национален електронски јазичен корпус. Во Европа, Македонија е единствена држава што нема таков национален корпус. Имаше неколку иницијативи, али сите беа безуспешни заради неразбирливи причини. 

Јас изработив еден таков мал примерен корпус од околу 1.5 милиони зборови со детални метаподатоци за секој извор со систем за тематска класификација на текстовите.  Жанровската класификација во македонскиот корпус ги вклучуваше следните жанрови: Вести, Драма, Економија, Еротика, Историја, Култура, Медицина, Мислења, Наука, Образование, Општество, Поезија, Политика, Право, Проза и Спорт. Обемноста на жанровите влијае врз пребарувањето во корпусот, што значи, колку пообемен е бројот на жанрови, толку пообемен ќе биде бројот на примери на специфични јазични форми кои се присутни во одредените жанрови. Исто така, разновидноста на текстовите дозволува да се прават споредни изучувања на лексички или граматички форми во неколку жанрови. Структурата на компјутерската база на текстовите беше доволно флексибилна за бројот на жанрови да може да се намали или пак евентуално да се прошири. Привремено корпусот беше ставен на сервер во универзитет Осло, али бидејќи немаше иницијатива корпусот да продолжи да се надградува во Македонија истиот сега е недостапен. Подетални информации за таков корпус има тука и тука.

На крај, многу ми е жал што таква огромна сума од 5.000.000 денари е потрошена за проект со минимална вредност, за микрофилми, pdf фајлови и за многу скапи кутии за нивно одржување, а со многу помала сума можеше да се обработи еден навистина лингвистички вреден почетен корпус што ќе му служеше на лингвисти низ целиот свет. Се прашувам, пред да се одобри овој проект, дали некој направил анкета меѓу лингвистите во Македонија, да ги праша дали имаат поголема потреба од скенирани картотеки во ИМЈ, или пак да се обработи Македонски национален јазичен корпус?

PS. Се извинувам за граматички грешки во мојов текст. Моето образование во Македонија беше само до осмо одделение во Подмочани.

November 11, 2022

Стојан Христов (Stoyan Christowe) и претседателот Франклин Д. Рузвелт

Стојан Христов беше писател, новинар, публицист со македонско потекло и сенатор на сојузната држава Вермонт во САД. Еден од неговите романи е „Ова е мојата татковина“ ("This is my country"). За него има често пишувано во македонските медиуми, каде понекогаш се споменува дека овој роман му бил омилен на америчкиот претседател Франклин Д. Рузвелт. Али никаде не се наведува извор за ова тврдење. Имено, кому Рузвелт му го кажал ова. Некои од македонските медиуми исто тврдат дека кога претседателот Франклин  Рузвелт починал на масата била оваа книга. Некои медиуми тврдата дека  книгата била најдена на канцелариската маса во Белата Куќа на Франклин Рузвелт, а некои дека на смртниот час, првото што наоѓаат на масата од Рузвелт е “Ова е мојата татковина”. Никој од медиумите не наведува извор за ова тврдење.

Претседателот Рузвелт почина во неговата „Мала Бела Куќа“ (Little White House) во гратчето Warm Springs во сојузната држава Georgia. Неговиот дом сега е државен музеј со своја веб страна. Од радозналост јас сакав да дознам колку е веродостојна информацијата дека оваа книга Рузвелт воопшто ја поседувал. На веб страната има фотографии од домот. Сите соби во домот се оставени во иста состојба како на денот кога Рузвелт починал. За да добијам точни информации за тоа дали книгата на Стојан Христов постои во овој дом јас се обратив по телефон (+1 706-655-5870 и +1 706-655-5927) до музејот „Мала Бела Куќа“ и разговарав со госпоѓата Robin Garret. Таа многу пријатно ме сослуша и ми објасни дека во музејот има шкафови со книги, исто така и список на сите книги во музејот. Ме замоли да и се јавам после еден час, додека таа не ги прегледа шкафовите со книги и списокот. И се јавив после час и пол, и госпоѓата ми кажа дека таа книга ја нема ни во шкафовите, ни во списокот. Али исто ми рече дека тоа не значи дека таа книга никогаш не била во домот. Ми рече, можно е сопругата на Рузвелт да ја има земено книгата со себе во нивниот дом во  гратчето Hyde Park.

Домот на Рузвелтови е во гратчето Hyde Park во сојузната држава New York, сега неговата Претседателска библиотека. Таа е личната библиотека на претседателот Рузвелт од приближно 22.000 тома. Библиотеката исто има веб страна со опција за пребарување на насловите во неа. Ако пребарувате по автор (Stoyan Christowe) ќе добиетге 0 резултати, што значи дека таму не постои ниедна книга од овој автор. Али, ако пребарувате по наслов ("This is my country"), што е исто така и наслов на романот на Стојан Христов, ќе добиете еден резултат, али тука се работи за илустриран атлас на Америка ("A pictorial map of the United States"), а не романот на Стојан Христов. Тогаш можно e да некој прочитал некаде дека во библиотеката на Рузвелт постои насловот "This is my country" и помислил дека се работи за книгата на Стојан Христов, не знаејќи дека се работи за сосема друга книга, за атлас на Америка. 

Дигитална верзија на книгата на Сотојан Христов на англиски е достапна и на онлајн продавницата на Barnes&Noble. Во детали за книгата таму пишува „It was one of the five books found on President Franklin D. Roosevelt's bedside table when he passed away“, била една од петте книги најдени на креветната маса на претседателот Франклин Д. Рузвелт кога починал. Ако е точно дека спалната соба каде почина Рузвелт е оставена онака како на денот кога тој почина, од фотографијата се гледа дека на таа локација нема никаква книга.


Да резумирам. Според моите досегашни истражувања книгата "This is my country" на Стојан Христов ја нема ни во „Малата Бела Куќа“ во гратчето Warm Springs, ни во Претседателската библиотека во гратчето Hyde Park, ни на креветната маса во спалната соба на Рузвелт. Од тие што тврдат дека се работи баш за книгата на Стојан Христов треба да бараме податоци за нивните извори:

1. Податокот дека Рузвелт ја поседувал оваа книга?

2. Податокот дека книгата на Стојан Христов му била подарена на Рузвелт од сопругата за роденден?

3. Кому Рузвелт му кажал дека оваа книга му била омилена, и дека Стојан Христов му бил омилен писател?

4. Ако оваа книга била една од петте други книги на неговата креветна маса, кои се другите четири книги?


October 25, 2022

Меморандум за разбирање или соработка

 Денес читам, Министерот за надворешни работи, Бујар Османи, во рамки на посетата на Јордан, се сретна со министерот за земјоделство, со кого потпишаа Меморандум за разбирање помеѓу Владата на Македонија и Владата на Јордан за соработка во областа на земјоделството.

Овде сакам да се осврнам на концептот и значењето на „Меморандум за разбирање“. Ако сакате да го пребарате овој термин во Гугл ќе добиете 16,500 резултати од Македонија. Можете да си замислите колку вакви меморандуми се потпишани од страна на државни установи, министри, итн. Читајќи вакви слични изјави, можеби же се прашате што точно значи концептот меморандум за разбирање. Не би сакал да ве разочарам, али морам да ви кажам дека тој термин нема апсолутно никакво практично значење. Значи, ни едната ни другата страна немаат апсолутно никаква обавеза за ништо!

Во овој случај ќе имало зголемување на извозот на овошје, зеленчук и јагнешко месо од Северна Македонија во Јордан, а од Јордан зголемување на увоз на маслиново масло и урми во Северна Македонија. Со меморандумот за разбирање ни едната ни другата страна не се обавезни да ги увезуваат овие продукти. Министерството за надворешни работи не може да му нареди на некое претпријатие во Македонија да ги увезува овие продукти, ако истите ги има за поевтина цена од некоја друга држава. Исто така, никој не му спречува на било кое претпријатие да увезува или извезува било што од или во Јордан, без да бара дозвола од Министерството за надворешни работи. И Јордан и Македонија се членки на Светската трговска организација, каде има правила за трговија помеѓу нејзини члени. Така да не значи дека пред потпишувањето на овој меморандум трговците во двете земји немаа право да тргуваат едни со други. Мислам дека ова ви е јасно.

Тогаш, која е целта на потпишување на вакви меморандуми? Тоа е само една убаво спакувана политичка реклама. Не дека македонските производители на зеленчук и месо за скоро време раце ќе тријат од радост. Владата секогаш мора да ги убедува граѓаните дека работи 24/7 за подобрување на нивниот живот, и ова е еден таков начин без да има било каква обавеза да ги оствари договорите од меморандумот.

Слични меморандуми се среќаваат и на веб страниците на приватните универзитети. Универзитетот во Македонија потпишал некој меморандум за соработка со некој врвен универзитет низ светот. Како тоа се случило? Ректорот на тој универзитет отишол на прошетка до Лондон, се сретнал со ректорот на некој тамошен универзитет, пиеле кафе, поразговарале, и нашиов му вели на нивниот, дај ако не ви е мака да потпишеме меморандум за соработка. А овие од Лондон веќе имаат стандардна форма за такви меморандуми, изгледаат многу убаво, формално и со убав златен печат, само треба да се смени името на универзитетот, да се потпише, и толку.

Нашиов се враќа во Македонија и веднаш дава изјава за македонските медиуми, како неговиот приватен универзитет потпишал меморандум за соработка со врвен универзитет во Лондон. Меморандумот се објавува на веб страната на универзитетот, и нивните студенти се гордеат што студираат на универзитет што соработува со врвен универзитет во Лондон. Исто и убава реклама за универзитетот.

Snezan

Закон за употреба на македонскиот јазик

Идејата за заштита на македонскиот јазик со закон од негова неправилна употреба е глупава и главно неостварлива. Идејата дека државата ќе ко...