ENG

ათი რჩევა ღია მონაცემთა შესახებ.

28 იანვარი, 2011
ჩვენ ეს დოკუმენტი შევქმენით როგორც სახელმძღვანელო, რათა დავეხმაროთ IT მენეჯერებს და სააგენტოების ხელმძღვანელებს ღია მონაცემთა ბაზის შექმნაში. თუმცა, ჩვენ ვერ ვითვალისწინებთ ყველა შემთხვევას, რადგან „მონაცემები“ ფართო ტერმინია და ზოგიერთი სახის მონაცემის სრული საჯაროობისთვის მისი გავრცელების ისეთი ფორმებია საჭირო, რომლებიც ჩვენს შემთხვევაში განხილული არ იქნება. ამასთან ერთად, არსებობს ისეთი საკითხებიც, როგორიცაა, მაგალითად, მონაცემთა ხელმისაწვდომობა შეზღუდული შესაძლებლობების მქონე პირთათვის, რომელსაც აქ არ განვიხილავთ, თუმცა კი ეს საკითხები ძალზე მნიშვნელოვანია ვებ–გვერდის გამართული და ეფექტური მუშაობისთვის.

საჯარო მონაცემები ისეთი მონაცემებია, რომელთა გავრცელება არ არის შეზღუდული ისეთი მიზეზის გამო, როგორიცაა პირადი ცხოვრების ხელშეუხებლობა, უსაფრთხოება ან რაიმე სხვა ლეგიტიმური ინტერესი. ეს სახელმძღვანელო არ განიხილავს დეტალურად იმას, თუ რომელი ინფორმაცია უნდა იყოს საჯარო. მიუხედავად ამისა, სამთავრობო მონაცემები უნდა განიხილებოდეს როგორც საჯარო, თუ არ არსებობს საერთაშორისო სამართალთან შესაბამისობაში მყოფი სპეციფიკური მიზეზი მისი საჯაროობის შეზღუდვისთვის. ამასთან, განაწყვეტილება მონაცემთა გასაიდუმლოების შესახებ საჯარო ინტერესებიდან უნდა გამომდინარეობდეს. თუ მონაცემების გასაიდუმლოება კანონის ფარგლებში ხდება, ეს მონაცემები რედაქტირებულ უნდა იქნეს და რედაქტირება მკაფიოდ უნდა იყოს ხაზგასმული, ხოლო მონაცემთა დანარჩენი ნაწილი საჯარო უნდა გახდეს ისევე, როგორც ინფორმაცია რედაქტირების მიზეზების შესახებ.

ღია (საჯარო) მონაცემები არის:

  1. სრული:
    ნებისმიერი მონაცემები, რომლებიც საჯარო მონაცემებს შეიცავს, გამოქვეყნებულ უნდა იქნეს. ეს ეხება არაციფრულ საარქივო მონაცემებს და ჯამური და შედგენილი რიცხვების მისაღებად გამოყენებულ მონაცემებსაც.
    • მონაცემთა ბაზის მრავალწლიანი არსებობის განმავლობაში, ქაღალდებზე დაფუძნებული არქივების ციფრულ ფორმატში გადატანა ხშირად რთულია. იდეალურ შემთხვევაში, ეს მონაცემები ხელმისაწვდომი უნდა იყოს, მაგრამ, არსებული შეზღუდული რესურსების გამო, მთავარი ამოცანა ისეთი სისტემების შექმნაა, რომლებიც საჯარო მონაცემების ციფრულ ფორმატში შეგროვებასა და გამოქვეყნებას ეფექტიანს გახდის. ამავდროულად, თუ შესაძლებელია, ახალი ციფრული სისტემები ისე უნდა იყოს შემუშავებული, რომ შესაძლებელი იყოს არაციფრული საარქივო მონაცემების დამატება ციფრულ ფორმატში მათი გადატანის შემდეგ.
    • ჯამური და შედგენილი რიცხვები წარმოდგენილ უნდა იქნეს მათ მისაღებად გამოყენებულ მონაცემებთან და მეთოდებთან ერთად. მაგალითად, ინფლაციის მაჩვენებელი უნდა მოიცავდეს სამომხმარებლო კალათის ფასებს, რომელიც ინფლაციის გასაზომად გამოიყენება.
  2. პირველადი:
    მონაცემები პირველწყაროდან უნდა იყოს აღებული და ისევე დეტალურად უნდა გამოქვეყნდეს, როგორც შეგროვდა.
    • შეგროვებისას, მონაცემები შეიძლება ყოველთვის არ იყოს წარმოდგენილი გამოსადეგი ფორმით (მაგ. სენსორის მონაცემები). ამ შემთხვევაში, შეიძლება განხორციელდეს შეგროვების-შემდგომი დამუშავება. თუმცა, დამუშავების შემდეგ მონაცემები ისეთ ფორმატში უნდა იქნეს წარმოდგენილი, რომელიც ასახავს მონაცემთა შეგროვების თავდაპირველი მექანიზმის სრულ შესაძლებლობებსა და დეტალურობას. მონაცემები არასოდეს არ უნდა დაიკარგოს.
  3. დროული:
    მონაცემები რაც შეიძლება სწრაფად უნდა გახდეს ხელმისაწვდომი, რათა მაქსიმალურად ფასეული იყოს საზოგადოებისთვის.
    • არ არსებობს დროის ერთი განსაზღვრული პერიოდი, რომელიც შესაბამისი იქნება ყველა სახის მონაცემებისათვის, მაგრამ, ხშირ შემთხვავაში, კარგად დამუშავებული სისტემა შესაძლებელს გახდის მონაცემების რეალურ დროში გამოქვეყნებას. ამგვარად, ინფორმაცია რაც შეიძლება მალე უნდა გამოქვეყნდეს.
    • მონაცემთა უფრო ფართო ბაზაში სიახლეების მოძიება იოლი უნდა იყოს ისეთი მექანიზმების საშუალებით, როგორიცაა RSS არხი, ძებნის ფუნქცია (რომელიც თარიღის მიხედვით მოახდენს მონაცემების ფილტრაციას) და არქივები (რომლებიც ამა თუ იმ მომენტში მონაცემთა ბაზის მდგომარეობის ამსახველ სურათბს შეიცავენ). წარმატებული საიტი, სავარაუდოდ, ასეთი მექანიზმების გარკვეულ კომბინაციას გამოიყენებს.
  4. ხელმისაწვდომი:
    მონაცემები ხელმისაწვდომი უნდა იყოს რაც შეძლება ბევრი მომხმარებლისთვის და გამოსადეგი უნდა იყოს მიზნების მაქსიმალურად ფართო სპექტრისთვის.
    • იოლი უნდა იყოს მონაცემების გაზიარება ციფრულ ფორმატში. ყოველ გამოქვეყნებულ გვერდსა და დოკუმენტს უნიკალური და ადვილად მისაღები „რესურსის უნიფიცირებული მაჩვენებელი“ (URL) უნდა ჰქონდეს, რომელიც ელექტრონული ფოსტისა და სოციალური საიტების მეშვეობით შეიძლება გავრცელდეს. ვებ–საიტების შექმნისას გამოყენებული ისეთი მეთოდები, როგორიცაა „Cookies“, „Flash“ და „AJAX/AHAH“ არ უნდა იქნეს გამოყენებული მონაცემთა მდებარეობის დასაფარად ან პირდაპირი ბმულების გაზიარების გასართულებლად.
    • URL-ები წარმოდგენილ უნდა იყოს მომხმარებლისთვის გასაგებ ფორმატში. მაგალითად: “www.domain.gov.ge/data/ministry/justice/complaints/2009/10/11/complaint.html” და არა “www.domain.gov.ge/data.php?lang=GEO&search_code=15&search_str=10,11,2009&type=4&min=01A” .
    • მონაცემთა სრული ხელმისაწვდომობისთვის არ უნდა იყოს საჭირო რეგისტრაცია ან თანხის გადახდა
    • ფაილების ერთიანი გადმოტვირთვა ხელმისაწვდომი უნდა იყოს ისეთი პროტოკოლების მეშვეობით როგორიცაა FTP ან rsync
    • იდეალურ შემთხვევაში, კარგად დოკუმენტირებული API ავტომატურად ხელმისაწვდომს გახდის შესაბამის მონაცემებს.
  5. მანქანის მიერ წაკითხვადი:
    მონაცემები ინახება იმ ფორმატითა და სტრუქტურით, რომელიც შესაძლებელს ხდის მის ავტომატიზირებულ დამუშავებას.
    • მანქანის მიერ წაკითხვადობამ არ უნდა შეცვალოს ადამიანების მიერ წაკითხვადობა. წარმოდგენილ უნდა იქნეს ორივე ფორმატი (მაგალითად, საიტზე უნდა განთავსდეს, როგორც გამოსვლის ტრანსკრიპტი, ისე მისი ჩანაწერი).
    • მონაცემები არასოდეს არ უნდა იყოს წარმოდგენილი მხოლოდ დასკანერებული სურათებით. დასკანერებული სურათები შეიძლება ისეთი დოკუმენტების განთავსების საუკეთესო გზა იყოს, როგორიცაა სანოტარო ბეჭდითა და ხელმოწერით დამოწმებული დოკუმენტი, მაგრამ მათ ყოველთვის თან უნდა ერთვოდეს დოკუმენტში მოყვანილი დანარჩენი ინფორმაცია ისეთ ფორმატში, რომლის აღქმაც მანქანას შეუძლია.
    • მონაცემები არასოდეს არ უნდა ინახებოდეს არაუნიკოდურ ფონტებში, როგორიცაა AcadNusx ან LitNusx.
    • მონაცემები წარმოდგენილი უნდა იყოს ადვილად დამუშავებად ფორმატში, როგორიცაა CSV, JSON ან XML.
    • ნებისმიერ შემთხვევაში, მონაცემთა თითოეული ველის მნიშვნელობა კარგად უნდა იყოს ახსნილი და ასეთი განმარტებები თან უნდა ერთვოდეს მონაცემებს.
  6. არადაპატენტებული:
    მონაცემები ხელმისაწვდომი იქნება ღია ფორმატში რომელზეც არავის არ ექნება ექსკლუზიური კონტროლი. ღია ფორმატში მონაცემების ასახვა უზრუნველყოფს, რომ მონაცემების დამუშავებისთვის საჭირო კომპიუტერული პროგრამები ყოველთვის ხელმისაწვდომი იქნება.
    • ღია ფორმატი არ ექვემდებარება ინტელექტუალურ საკუთრების კონტროლს არც ერთ ქვეყანაში, ხოლო ფორმატის სტრუქტურის განმსაზრვრელი დოკუმენტები თავისუფლად არის ხელმისაწვდომი. HTML და XML ღია ფორმატის მაგალითებია.
    • უპირატესობა უნდა მიენიჭოს მარტივ ფორმატებს და ფორმატებს, რომლებსაც მრავალი პროგრამა კითხულობს. მაგალითად, ფორმატები როგორიცაა XML და JSON უკეთესია, ვიდრე PDF და OOXML (OOXML საყოველთაოდ ცნობილია როგორც MS Office. docx, pptx, და xlsx ფორმატები).
  7. ლიცენზიისგან თავისუფალი:
    მონაცემები არ ექვემდებარება ინტელექტუალურ საკუთრების დაცვას, როგორიცაა საავტორო ან სავაჭრო ნიშანი და ამ სტატუსის გადამოწმება იოლია.
    • მონაცემები უნდა იყოს უფასო ყველა ტიპის გამოყენებისათვის (მათ შორის, კომერციული მოხმარებისთვის) შეზღუდვის გარეშე.
    • მაშინაც კი, როდესაც კანონი მკაფიოდ აცხადებს, რომ საჯარო სამთავრობო მონაცემების გამოყენება უფასოა, ეს დამატებიოთ უნდა იქნეს მითითებული მონაცემების ყოველი გამოქვეყნებისას.
  8. ექვემდებარებოდეს გადასინჯვას:
    ყველა საჯარო თუ კერძო ორგანომ, რომელიც ამ მონაცემებს აქვეყნებს, უნდა დანიშნოს პირი, რომელიც უპასუხებს კითხვებსა და საჩივრებს მონაცემთა შესახებ. ამ პირის საკონტაქტო ინფორმაცია თან უნდა დაერთოს მონაცემებს.
  9. იოლად მისაგნები:
    მონაცემები მომხმარებლისათვის ადვილად მისაგნები უნდა იყოს. მონაცემები შესაბამის კატალოგში უნდა იქნეს შეტანილი, ხოლო მონაცემთა ვებ–გვერდი ხელმისაწვდომი უნდა იყოს საძიებო სისტემებში.
    • იდეალურ შემთხვევაში, ყველა სამთავრობო დაწესებულებამ მონაცემების ონლაინ რეჟიმში განთავსების ერთი და იგივე საშუალება უნდა გამოიყენოს, რათა მომხმარებლებს სწრაფად შეეძლოთ ნებისმიერი სააგენტოს მიერ გამოქვეყნებული მონაცემების მიღები მისი ინტერნეტ–საიტიდან.
    • სააგენტოებმა უნდა უზრუნველყონ, რომ პორტალური ვებგვერდებზე განთავსებული სამთავრობო მონაცემების კატალოგები ზუსტი და განახლებული იყოს.
    • სააგენტოებმა უნდა შეიმუშავონ ვებ–გვერდების ამომწურავი რუკები და წარადგინონ ისინი ყველა ძირითად საძიებო სისტემებში.
  10. მუდმივი:
    მოძველების შემთხვევაში, მონაცემები ისე უნდა იყოს დაარქივებულ,ი რომ ზემოთ მოცემული კრიტერიუმები დააკმაყოფილოს.s

ეს სახელმძღვანელო მომზადებულია ფონდ „Sunlight“-ის, Access-Info Europe-ის, OpenGovData.org-ის და სხვა ორგანიზაციების მიერ გამოქვეყნებული სახელმძღვანელოების საფუძველზე. დასაშვებია ამ დოკუმენტისა და მისი შინაარსის გამოყენება, შეცვლა და ხელახლა გავრცელება. ამასთან, ნებისმიერი ცვლილების შემთხვევაში, მითითებული უნდა იყოს, რომ ეს ცვლილებები მათ ავტორებს ეკუთვნის და არა „საერთაშორისო გამჭვირვალობა - საქართველოს“ ან „საერთაშორისო გამჭვირვალობას“.

მხარდამჭერი: Access Info Europe ლოგო ინფორმაციის თავისუფლების განვიტარების ინსტიტუტი

Creative Commons–ის ლიცენზია
ათი რჩევა ღია მონაცემთა შესახებ.
შექმნილი საერთაშორისო გამჭვირვალობა საქართველოს მიერ
ლიცენზირებულია Creative Commons ავტორობის მითითებით 3.0 არაპორტირებული ლიცენზიით.
ეფუძნება ნაწარმოებს, განლაგებულს transparency.ge.
ამ ლიცენზიის მიღმა ნებართვის მიღება შესაძლებელია მისამართზე http://transparency.ge/en/ten-open-data-guidelines.

ამ დოკუმენტთან დაკავშირებული საკონტაქტო პირი არის დერეკ დოლერი

გვერდის ბოლო ცვლილების თარიღია: 31 იანვარი, 2011