ഒക്ടോബർ 2004; 19 years ago (2004-10) (as Google Print)
നിജസ്ഥിതി
പ്രവർത്തനക്ഷമം
ഉപയോക്താക്കൾക്ക് ഓൺലൈൻ ആയി പുസ്തകങ്ങൾ വായിക്കാൻ അല്ലെങ്കിൽ ഏതെങ്കിലും വാക്കുകൾ പുസ്തകങ്ങൾക്കുള്ളിൽ തിരയാൻ സഹായിക്കുന്ന പൂർണ്ണമായ ഡിജിറ്റൽ ലൈബ്രറി സൃഷ്ടിക്കാൻ ഗൂഗിൾ കമ്പനി ആരംഭിച്ച ഒരു പ്രോജക്റ്റാണ് ഗൂഗിൾ ബുക്സ്. ഇത് വെബ് സെർച്ച് പോലെ തന്നെ തിരയുന്ന പദങ്ങൾ അടങ്ങിയ പുസ്തക താളുകൾ അല്ലെങ്കിൽ പദങ്ങൾ ഉള്ള വരികൾ കാണിച്ചു തരുന്നു. ഗൂഗിൾ ബുക്സ് മുമ്പ് ഗൂഗിൾ ബുക്ക് സെർച്ച് അല്ലെങ്കിൽ ഗൂഗിൾ പ്രിന്റ് എന്നും അതിന്റെ കോഡ് നാമമായ പ്രോജക്റ്റ് ഓഷ്യൻ എന്നും അറിയപ്പെട്ടിരുന്നു.
ഗൂഗിൾ സെർച്ച് അല്ലെങ്കിൽ സമർപ്പിത ഗൂഗിൾ ബുക്സ് തിരയൽ വെബ്സൈറ്റ് (ബുക്സ്.ഗൂഗിൾ.കോം) വഴി പദങ്ങൾ തിരയുമ്പോൾ, സ്കാൻ ചെയ്ത് ഒപ്റ്റിക്കൽ ക്യാരക്ടർ റെക്കഗ്നിഷൻ (OCR) ഉപയോഗിച്ച് ടെക്സ്റ്റിലേക്ക് പരിവർത്തനം ചെയ്ത്, ഗൂഗിൾ അതിന്റെ ഡിജിറ്റൽ ഡാറ്റാബേസിൽ സംഭരിച്ചിരിക്കുന്ന പുസ്തകങ്ങളിൽ അല്ലെങ്കിൽ മാസികകളിൽ നിന്നും തിരയൽ പദങ്ങളുമായി പൊരുത്തപ്പെടുന്ന ഉള്ളടക്കമുള്ള ഭാഗം കാണിച്ചു തരുന്നു. പ്രസാധകരും രചയിതാക്കളും ഗൂഗിൾ ബുക്സ് പാർട്ണർ പ്രോഗ്രാം വഴിയോ ഗൂഗിളിന്റെ ലൈബ്രറി പങ്കാളികൾ ലൈബ്രറി പ്രോജക്റ്റ് വഴിയോ ആണ് ഡാറ്റാബേസിൽ സംഭരിച്ചിരിക്കുന്ന പുസ്തകങ്ങൾ ലഭിക്കുന്നത്. കൂടാതെ, അവരുടെ ആർക്കൈവുകൾ ഡിജിറ്റൈസ് ചെയ്യുന്നതിനായി ഗൂഗിൾ നിരവധി മാഗസിൻ പ്രസാധകരുമായി സഹകരിച്ചിട്ടുണ്ട്.
2004 ഒക്ടോബറിൽ ഫ്രാങ്ക്ഫർട്ട് പുസ്തകമേളയിൽ അവതരിപ്പിക്കുമ്പോൾ പബ്ലിഷർ പ്രോഗ്രാം, ഗൂഗിൾ പ്രിന്റ് എന്നാണ് അറിയപ്പെട്ടിരുന്നത്. പങ്കാളികളായ ലൈബ്രറികളുടെ ശേഖരത്തിലെ സൃഷ്ടികൾ സ്കാൻ ചെയ്ത് ഡിജിറ്റൽ ഇൻവെന്ററിയിലേക്ക് ചേർക്കുന്ന ഗൂഗിൾ ബുക്സ് ലൈബ്രറി പ്രോജക്റ്റ് 2004 ഡിസംബറിൽ പ്രഖ്യാപിച്ചു.
മാനുഷിക അറിവിന്റെ ജനാധിപത്യവൽക്കരണത്തെ പ്രോത്സാഹിപ്പിക്കുന്നതും, അറിവിന്റെ ഏറ്റവും വലിയ ഓൺലൈൻ ബോഡിയായി മാറിയേക്കാവുന്നതും ആയ ഗൂഗിൾ ബുക്സ് സംരംഭം വിവര ശേഖരത്തിലേക്ക് അഭൂതപൂർവമായ പ്രവേശനം വാഗ്ദാനം ചെയ്യുന്നതിനുള്ള സാധ്യതകളുടെ പേരിൽ പ്രശംസിക്കപ്പെട്ടിട്ടുണ്ട്. എന്നിരുന്നാലും, പകർപ്പവകാശ ലംഘനങ്ങളുടെ പേരിലും, ഓസിആർ പ്രോസസ്സ് വഴി സ്കാൻ ചെയ്ത ടെക്സ്റ്റുകളിലെ പിശകുകൾ തിരുത്താത്തതിൻ്റെ പേരിലും ഇത് വിമർശിക്കപ്പെട്ടിട്ടുണ്ട്.
2019 ഒക്ടോബറിൽ ഗൂഗിൾ ബുക്സിന്റെ 15 ആം വർഷം ആഘോഷിക്കുകയും, ആ കാലയളവിൽ സ്കാൻ ചെയ്ത പുസ്തകങ്ങളുടെ എണ്ണം 40 ദശലക്ഷത്തിലധികം ആകുകയും ചെയ്തു. 2010 ൽ, ലോകത്ത് ഏകദേശം 130 ദശലക്ഷം വ്യത്യസ്ത പുസ്തകങ്ങൾ ഉണ്ടായിരുന്നു എന്നും, അവയെല്ലാം സ്കാൻ ചെയ്ത് സൂക്ഷിക്കുകയാണ് തങ്ങളുടെ ലക്ഷ്യം എന്നും ഗൂഗിൾ പ്രഖ്യാപിക്കുകയുണ്ടായി. എന്നിരുന്നാലും, അമേരിക്കൻ അക്കാദമിക് ലൈബ്രറികളിലെ സ്കാനിംഗ് പ്രക്രിയ മന്ദഗതിയിലാണ്. ഗൂഗിൾ ബുക്കിന്റെ സ്കാനിംഗ് ശ്രമങ്ങൾ കോടതി നടപടികൾക്കും കാരണമായിട്ടുണ്ട്. യു എസ് കോടതിയിലെ ഓതേഴ്സ് ഗിൽഡ് v. ഗൂഗിൾ കേസിൽ ഗൂഗിളിന് അനുകൂലമായി വിധി വരികയുണ്ടായി (ചുവടെ കാണുക). യുണൈറ്റഡ് സ്റ്റേറ്റ്സിലെ, പകർപ്പവകാശമുള്ള ഉടമ ആരെന്നറിയാത്തതോ അല്ലെങ്കിൽ പകർപ്പവകാശമുള്ള ഉടമയുമായി ബന്ധപ്പെടാൻ കഴിയാത്തതോ അനാഥ സൃഷ്ടികളുടെ പകർപ്പവകാശ സമ്പ്രദായങ്ങൾ മാറ്റുന്ന വിഷയത്തിലെ ഒരു പ്രധാന കേസായിരുന്നു ഇത്.
വിശദാംശങ്ങൾ
ഗൂഗിൾ ബുക്സ്-ൽ നിന്നുള്ള ഫലങ്ങൾ ഗൂഗിൾ തിരയലിലും സമർപ്പിത ഗൂഗിൾ ബുക്സ് തിരയൽ വെബ്സൈറ്റിലും (books.google.com) കാണിക്കുന്നു.
തിരയലിന് മറുപടിയായി, പുസ്തകം പകർപ്പവകാശത്തിന് പുറത്താണെങ്കിൽ അല്ലെങ്കിൽ പകർപ്പവകാശ ഉടമ അനുമതി നൽകിയിട്ടുണ്ടെങ്കിൽ, തിരയൽ പദങ്ങൾ ഉള്ള പുസ്തകങ്ങളിൽ നിന്നുള്ള മുഴുവൻ പേജുകളും കാണാൻ ഗൂഗിൾ ബുക്സ് ഉപയോക്താക്കളെ അനുവദിക്കുന്നു. പുസ്തകം ഇപ്പോഴും പകർപ്പവകാശത്തിൻ കീഴിലാണെന്ന് ഗൂഗിൾ ബുക്സ് വിശ്വസിക്കുന്നുവെങ്കിൽ, മുഴുവൻ പേജിന് പകരം ഉപയോക്താവ് അന്വേഷിച്ച പദങ്ങൾക്ക് ചുറ്റുമുള്ള വാചകത്തിന്റെ "സ്നിപ്പെറ്റുകൾ" മാത്രം കാണിക്കുന്നു, ഒപ്പം പുസ്തകത്തിലെ ആ പദങ്ങൾ മഞ്ഞനിറത്തിൽ ഹൈലൈറ്റ് ചെയ്ത് ദൃശ്യമാകും.
ഗൂഗിൾ ബുക്സിൽ ഉപയോഗിക്കുന്ന നാല് ആക്സസ് ലെവലുകൾ ഇവയാണ്:
ഫുൾ വ്യൂ: പൊതുസഞ്ചയത്തിലുള്ള പുസ്തകങ്ങളുടെ പേജ് പൂർണ്ണമായി കാണാൻ കഴിയും, കൂടാതെ അവ സൗജന്യമായി ഡൗൺലോഡ് ചെയ്യാവുന്നതുമാണ്. അപൂർവമാണെങ്കിലും, പാർട്ണർ പ്രോഗ്രാമിലൂടെ നേടിയ ഇൻ-പ്രിന്റ് ബുക്കുകളും പ്രസാധകൻ അനുമതി നൽകിയിട്ടുണ്ടെങ്കിൽ പൂർണ്ണമായി കാണുന്നതിന് ലഭ്യമാണ്.
പ്രിവ്യൂ: അനുമതി നൽകിയിട്ടുള്ള ഇൻ-പ്രിന്റ് ബുക്കുകൾക്ക്, കാണാവുന്ന പേജുകളുടെ എണ്ണം വിവിധ ആക്സസ് നിയന്ത്രണങ്ങളും സുരക്ഷാ നടപടികളും ഉപയോഗിച്ച് സജ്ജമാക്കിയ ഒരു "പ്രിവ്യൂ" ആയി പരിമിതപ്പെടുത്തിയിരിക്കുന്നു. സാധാരണയായി, പ്രിവ്യൂവിന് ലഭ്യമായ പുസ്തക പേജുകളുടെ ശതമാനം പ്രസാധകന് സജ്ജമാക്കാൻ കഴിയും. പ്രിവ്യൂ പുസ്തകങ്ങൾ പകർത്തുന്നതിനോ ഡൗൺലോഡ് ചെയ്യുന്നതിനോ പ്രിന്റ് ചെയ്യുന്നതിനോ ഉപയോക്താക്കൾക്ക് നിയന്ത്രണമുണ്ട്. "പകർപ്പവകാശമുള്ള മെറ്റീരിയൽ" എന്ന വാട്ടർമാർക്ക് വായനയ്ക്ക് ദൃശ്യമാകുന്ന പേജുകളുടെ ചുവടെ ദൃശ്യമാകുന്നു. പാർട്ണർ പ്രോഗ്രാമിലൂടെ നേടിയ എല്ലാ പുസ്തകങ്ങളും പ്രിവ്യൂ വായനയിൽ ലഭ്യമാണ്.
സ്നിപ്പെറ്റ് വ്യൂ: പകർപ്പവകാശ ഉടമയുടെ അനുമതിയില്ലാത്ത സന്ദർഭങ്ങളിൽ ഒരു "സ്നിപ്പെറ്റ് വ്യൂ" വഴി ഗൂഗിൾ, അന്വേഷിച്ച തിരയൽ പദത്തെ ചുറ്റിപ്പറ്റിയുള്ള രണ്ട് മൂന്ന് വരികൾ മാത്രം പ്രദർശിപ്പിക്കും. ഗൂഗിളിന് ഉടമയെ തിരിച്ചറിയാൻ കഴിയാത്തതിനാലോ ഉടമ അനുമതി നിരസിച്ചതിനാലോ ആകാം ഇത്. ഒരു പുസ്തകത്തിൽ ഒരു തിരയൽ പദം നിരവധി തവണ പ്രത്യക്ഷപ്പെടുകയാണെങ്കിൽ, ഗൂഗിൾ മൂന്നിൽ കൂടുതൽ സ്നിപ്പെറ്റുകൾ പ്രദർശിപ്പിക്കില്ല, അതുവഴി ഉപയോക്താവ് പുസ്തകത്തിന്റെ വളരെയധികം ഭാഗം കാണുന്നത് തടയുന്നു. കൂടാതെ, നിഘണ്ടുക്കൾ പോലുള്ള ചില റഫറൻസ് പുസ്തകങ്ങൾക്ക് ഗൂഗിൾ സ്നിപ്പെറ്റുകൾ പോലും പ്രദർശിപ്പിക്കില്ല, കാരണം സ്നിപ്പെറ്റുകൾ പ്രദർശിപ്പിക്കുന്നത് പോലും സൃഷ്ടിയുടെ വിപണിയെ ദോഷകരമായി ബാധിക്കും. സ്നിപ്പറ്റ് കാഴ്ച പ്രദർശിപ്പിക്കുന്നതിന് പകർപ്പവകാശ നിയമപ്രകാരം അനുമതി ആവശ്യമില്ലെന്ന് ഗൂഗിൾ വാദിക്കുന്നു.
നൊ പ്രിവ്യൂ: ഡിജിറ്റൈസ് ചെയ്യാത്ത പുസ്തകങ്ങൾക്കായുള്ള തിരയൽ ഫലങ്ങളും ഗൂഗിൾ പ്രദർശിപ്പിക്കുന്നു. ഈ പുസ്തകങ്ങൾ സ്കാൻ ചെയ്തിട്ടില്ലാത്തതിനാൽ, അവയുടെ വാചകം തിരയാൻ കഴിയില്ല, എന്നാൽ ശീർഷകം, രചയിതാവ്, പ്രസാധകൻ, പേജുകളുടെ എണ്ണം, ഐഎസ്ബിഎൻ, വിഷയം, പകർപ്പവകാശ വിവരങ്ങൾ എന്നിവ പോലുള്ള മെറ്റാഡാറ്റയും ചില സന്ദർഭങ്ങളിൽ, ഉള്ളടക്ക പട്ടികയും പുസ്തക സംഗ്രഹവും ലഭ്യമാകും. ഫലത്തിൽ, ഇത് ഒരു ഓൺലൈൻ ലൈബ്രറി കാർഡ് കാറ്റലോഗിന് സമാനമാണ്.
അമേരിക്കൻ അസോസിയേഷൻ ഓഫ് പബ്ലിഷേഴ്സ്, ഓതേഴ്സ് ഗിൽഡ് തുടങ്ങിയ ഗ്രൂപ്പുകളിൽ നിന്നുള്ള വിമർശനങ്ങൾക്ക് മറുപടിയായി, ഗൂഗിൾ 2005 ഓഗസ്റ്റിൽ ഒരു ഓപ്റ്റ്-ഔട്ട് നയം പ്രഖ്യാപിച്ചു, അതിലൂടെ പകർപ്പവകാശ ഉടമകൾക്ക് ഗൂഗിളിനെ സ്കാൻ ചെയ്യാൻ അനുവദിക്കേണ്ടതില്ലാത്ത പുസ്തക ശീർഷകങ്ങളുടെ ഒരു ലിസ്റ്റ് നൽകാം. 2005 ആഗസ്റ്റിനും നവംബർ 1 നും ഇടയിൽ പകർപ്പവകാശമുള്ള പുസ്തകങ്ങളൊന്നും സ്കാൻ ചെയ്യില്ലെന്നും, പ്രോജക്റ്റിൽ നിന്ന് ഏതൊക്കെ പുസ്തകങ്ങൾ ഒഴിവാക്കണമെന്ന് ഉടമകൾക്ക് തീരുമാനിക്കാനുള്ള അവസരം നൽകുമെന്നും കമ്പനി വ്യക്തമാക്കിയിരുന്നു. അതിനാൽ, പകർപ്പവകാശ ഉടമകൾക്ക് ഏതൊരു സൃഷ്ടിയെയും സംബന്ധിച്ച് മൂന്ന് തിരഞ്ഞെടുപ്പുകൾ ഉണ്ട്:
പ്രിവ്യൂവിനോ പൂർണ്ണമായ കാഴ്ചയ്ക്കോ ഒരു പുസ്തകം ലഭ്യമാക്കുന്നതിന് ഗൂഗിളിന്റെ പാർട്ട്ണർഷിപ്പ് പ്രോഗ്രാമിൽ പങ്കെടുക്കാം, ഈ സാഹചര്യത്തിൽ പേജുകളുടെ പ്രദർശനത്തിൽ നിന്ന് ലഭിക്കുന്ന വരുമാനം പങ്കിടും.
ലൈബ്രറി പ്രോജക്റ്റിന് കീഴിലുള്ള പുസ്തകം സ്കാൻ ചെയ്യാനും ഉപയോക്തൃ ചോദ്യങ്ങൾക്ക് മറുപടിയായി സ്നിപ്പെറ്റുകൾ പ്രദർശിപ്പിക്കാനും ഇത് ഗൂഗിളിനെ അനുവദിക്കും.
വേണമെങ്കിൽ ലൈബ്രറി പ്രോജക്റ്റിൽ നിന്ന് പുസ്തകം ഒഴിവാക്കാനാകും, ഈ സാഹചര്യത്തിൽ ഗൂഗിൾ പുസ്തകം സ്കാൻ ചെയ്യില്ല. പുസ്തകം ഇതിനകം സ്കാൻ ചെയ്തിട്ടുണ്ടെങ്കിൽ, ഗൂഗിൾ അതിന്റെ ആക്സസ് ലെവൽ 'പ്രിവ്യൂ ഇല്ല' എന്ന് പുനഃസജ്ജമാക്കും.
സ്കാൻ ചെയ്ത മിക്ക സൃഷ്ടികളും ഇപ്പോൾ അച്ചടിയിലോ വാണിജ്യാടിസ്ഥാനത്തിലോ ലഭ്യമല്ല.
ലൈബ്രറികളിൽ നിന്ന് ശേഖരിക്കുന്നതിന് പുറമേ, പ്രസാധകരെയും രചയിതാക്കളെയും അവരുടെ പുസ്തകങ്ങൾ പ്രമോട്ട് ചെയ്യാൻ സഹായിക്കുന്നതിന് രൂപകൽപ്പന ചെയ്തിരിക്കുന്ന "പാർട്ട്ണർ പ്രോഗ്രാം" വഴിയും ഗൂഗിൾ അതിന്റെ പ്രസാധക പങ്കാളികളിൽ നിന്ന് പുസ്തകങ്ങൾ നേടുന്നു. പ്രസാധകരും രചയിതാക്കളും അവരുടെ പുസ്തകത്തിന്റെ ഒരു ഡിജിറ്റൽ കോപ്പി (ഇപബ് അല്ലെങ്കിൽ പിഡിഎഫ്) അല്ലെങ്കിൽ ഒരു പ്രിന്റ് കോപ്പി ഗൂഗിളിന് നല്കുന്നു. പുസ്തകത്തിന്റെ പ്രിവ്യൂവിന് ലഭ്യമായ ശതമാനം പ്രസാധകന് നിയന്ത്രിക്കാനാകും, എന്നിരുന്നാലും കുറഞ്ഞത് 20% ആണ്. അവർക്ക് പുസ്തകം പൂർണ്ണമായി കാണാവുന്നതാക്കാനും ഉപയോക്താക്കളെ ഒരു പിഡിഎഫ് പകർപ്പ് ഡൗൺലോഡ് ചെയ്യാൻ അനുവദിക്കാനും കഴിയും. ഗൂഗിൾ പ്ലേയിൽ പുസ്തകങ്ങൾ വിൽപ്പനയ്ക്ക് ലഭ്യമാക്കുകയും ചെയ്യാം. ലൈബ്രറി പ്രോജക്റ്റിൽ നിന്ന് വ്യത്യസ്തമായി, ഇത് പ്രസാധകരുമായുള്ള കരാറിന് അനുസൃതമായി നടക്കുന്നതിനാൽ പകർപ്പവകാശ ആശങ്കകളൊന്നും ഉയർത്തുന്നില്ല. പ്രസാധകന് എപ്പോൾ വേണമെങ്കിലും കരാറിൽ നിന്ന് പിന്മാറാം.
പല പുസ്തകങ്ങൾക്കും, ഗൂഗിൾ ബുക്സ് യഥാർത്ഥ പേജ് നമ്പറുകൾ പ്രദർശിപ്പിക്കുന്നു. എന്നിരുന്നാലും, 2014-ൽ ന്യൂയോർക്ക് റിവ്യൂ ഓഫ് ബുക്സിൽ ടിം പാർക്ക്സ്, ഗൂഗിൾ സമീപകാല പ്രസിദ്ധീകരണങ്ങൾക്ക് (പാർട്ടണർഷിപ്പ് പ്രോഗ്രാമിലൂടെ നേടിയവ) പേജ് നമ്പർ നൽകുന്നത് നിർത്തിയതായി അഭിപ്രായപ്പെട്ടു.
പുസ്തകങ്ങളുടെ സ്കാനിംഗ്
പ്രോജക്ട് ഓഷ്യൻ എന്ന രഹസ്യനാമത്തിൽ 2002 ലാണ് പദ്ധതി ആരംഭിച്ചത്. ഗൂഗിൾ സഹസ്ഥാപകനായ ലാറി പേജിന് എപ്പോഴും പുസ്തകങ്ങൾ ഡിജിറ്റൈസ് ചെയ്യുന്നതിൽ താൽപ്പര്യമുണ്ടായിരുന്നു. 2002-ൽ അദ്ദേഹവും മരിസ മേയറും ബുക്ക് സ്കാനിംഗ് പരീക്ഷിക്കാൻ തുടങ്ങിയപ്പോൾ, 300 പേജുള്ള ഒരു പുസ്തകം ഡിജിറ്റൈസ് ചെയ്യാൻ 40 മിനിറ്റെടുത്തു. എന്നാൽ മണിക്കൂറിൽ 6000 പേജുകൾ വരെ സ്കാൻ ചെയ്യാൻ കഴിയുന്ന തരത്തിൽ പിന്നീട് സാങ്കേതികവിദ്യ വികസിച്ചു.
സ്കാൻ ചെയ്യാൻ ഗൂഗിൾ പ്രത്യേക സ്കാനിംഗ് കേന്ദ്രങ്ങൾ സ്ഥാപിച്ചു. അവിടേക്ക് ട്രക്കുകളിൽ പുസ്തകങ്ങൾ കൊണ്ടുപോകുന്നു. കസ്റ്റമൈസ് ചെയ്ത എൽഫെൽ 323 ക്യാമറ ഉപയോഗിച്ചു മണിക്കൂറിൽ 1,000 പേജുകൾ എന്ന നിരക്കിൽ ആണ് പല പുസ്തകങ്ങളും സ്കാൻ ചെയ്യുന്നത്. പുസ്തകങ്ങളുടെ ഡിജിറ്റയിസെഷൻ മൂന്ന് തലങ്ങളിൽ ആയാണ് നടക്കുന്നത്. ആദ്യം, ഡി-വാർപ്പിംഗ് അൽഗോരിതങ്ങൾ ലിഡാർ ഡാറ്റ ഉപയോഗിച്ചു പേജുകളുടെ വക്രത പരിഹരിക്കുന്നു, തുടർന്ന്, ഒപ്റ്റിക്കൽ ക്യാരക്ടർ റെക്കഗ്നിഷൻ (OCR) സോഫ്റ്റ്വെയർ ചിത്രങ്ങളെ ടെക്സ്റ്റാക്കി മാറ്റുന്നു, അവസാനമായി, മറ്റൊരു റൗണ്ട് അൽഗോരിതം പേജ് നമ്പറുകളും അടിക്കുറിപ്പുകളും ചിത്രീകരണങ്ങളും ഡയഗ്രാമുകളും എക്സ്ട്രാക്റ്റ് ചെയ്യുന്നു.
2009-ൽ ഗൂഗിളിന് ലഭിച്ച ഒരു പേറ്റന്റ്, രണ്ട് ക്യാമറകളും ഇൻഫ്രാറെഡ് ലൈറ്റും ഉപയോഗിച്ച് പുസ്തകങ്ങൾ സ്കാൻ ചെയ്യുന്നതിനുള്ള ഒരു നൂതന സംവിധാനം ഗൂഗിൾ കൊണ്ടുവന്നതായി വെളിപ്പെടുത്തി. ഓരോ പേജിന്റെയും ഒരു 3D മോഡൽ നിർമ്മിച്ച് അതിനെ "ഡി-വാർപ്പ്" ചെയ്യുന്നതിലൂടെ, പേജുകൾ ഫ്ലാറ്റ് ആക്കാതെ തന്നെ പരന്ന രൂപത്തിലുള്ള പേജുകൾ അവതരിപ്പിക്കാൻ ഗൂഗിളിന് കഴിയും, ഇതിന് വ്യക്തിഗതമായി അൺബൈൻഡിംഗ് അല്ലെങ്കിൽ ഗ്ലാസ് പ്ലേറ്റുകൾ പോലുള്ള രീതികൾ ആവശ്യമാണ്. വലിയ തോതിലുള്ള സ്കാനിംഗിന് ഇത് കാര്യക്ഷമമല്ല.
അക്കാലത്ത് പകർപ്പവകാശത്തിന് പുറത്തുള്ള മിക്ക പുസ്തകങ്ങളിലും നിറങ്ങൾ അടങ്ങിയിട്ടില്ലാത്തതിനാൽ, മികച്ച സ്പേഷ്യൽ റെസല്യൂഷന് വേണ്ടി വർണ്ണ വിവരങ്ങൾ ഒഴിവാക്കാൻ ഗൂഗിൾ തീരുമാനിച്ചു. ഫുൾ-ടെക്സ്റ്റ് തിരയൽ പ്രവർത്തനക്ഷമമാക്കാൻ ടെക്സ്റ്റ് റീജിയണുകൾ ഓസിആർ വഴി പ്രോസസ്സ് ചെയ്തു. കുറഞ്ഞ ബാൻഡ്വിഡ്ത്ത് ഉള്ള ഇന്റർനെറ്റ് ഉപയോക്താക്കൾക്ക് ആക്സസ്സ് പ്രാപ്തമാക്കുന്നതിന് ഫയൽ വലുപ്പങ്ങൾ കുറച്ചുകൊണ്ടു തന്നെ ഉയർന്ന ഇമേജ് നിലവാരം കൈവരിക്കുന്നത് ലക്ഷ്യമിട്ട് ഒപ്റ്റിമൽ കംപ്രഷൻ ടെക്നിക്കുകൾ കൊണ്ടുവരുന്നതിനും ഗൂഗിൾ ശ്രമങ്ങൾ നടത്തി.
വെബ്സൈറ്റ് പ്രവർത്തനം
ഓരോ വർക്കിനും, ഗൂഗിൾ ബുക്സ് സ്വയമേവ ഒരു അവലോകന പേജ് സൃഷ്ടിക്കുന്നു. ഈ പേജ്, പുസ്തകത്തിൽ നിന്ന് വേർതിരിച്ചെടുത്ത വിവരങ്ങൾ, അതിന്റെ പ്രസിദ്ധീകരണ വിശദാംശങ്ങൾ, ഉയർന്ന ഫ്രീക്വൻസി വേഡ് മാപ്പ്, ഉള്ളടക്ക പട്ടിക-അതുപോലെ സംഗ്രഹങ്ങൾ, റീഡർ റിവ്യൂകൾ (വെബ്സൈറ്റിന്റെ മൊബൈൽ പതിപ്പിൽ വായിക്കാൻ കഴിയില്ല), ലിങ്കുകൾ എന്നിവ പോലുള്ള ദ്വിതീയ മെറ്റീരിയലുകൾ പ്രദർശിപ്പിക്കുന്നു. മറ്റ് പ്രസക്തമായ ഗ്രന്ഥങ്ങളിലേക്ക്. ഉദാഹരണത്തിന്, പേജിലെ ഒരു സന്ദർശകൻ സമാനമായ വിഭാഗവും തീമും പങ്കിടുന്ന പുസ്തകങ്ങളുടെ ഒരു ലിസ്റ്റ് കണ്ടേക്കാം. ഈ ഉള്ളടക്കം, കൂടാതെ, അവരുടെ ഗൂഗിൾ അക്കൗണ്ടിൽ സൈൻ ഇൻ ചെയ്തിരിക്കുന്ന ഉപയോക്താക്കൾക്ക്, ഗ്രന്ഥസൂചിക ഡാറ്റയും അവലംബങ്ങളും സ്റ്റാൻഡേർഡ് ഫോർമാറ്റുകളിൽ എക്സ്പോർട്ടുചെയ്യാനും അവരുടെ സ്വന്തം അവലോകനങ്ങൾ എഴുതാനും ടാഗ് ചെയ്യാനും ഓർഗനൈസ് ചെയ്യാനും മറ്റ് ആളുകളുമായി പങ്കിടാനും അത് അവരുടെ ലൈബ്രറിയിൽ ചേർക്കാനും കഴിയും. അതിനാൽ, ഗൂഗിൾ ബുക്സ് ഉപയോക്താക്കൾ, ഗുഡ്റീഡ്സ് പോലുള്ള മൂന്നാം കക്ഷി സൈറ്റുകൾ, പുസ്തകത്തിന്റെ രചയിതാവ്, പ്രസാധകൻ എന്നിവരുൾപ്പെടെ നിരവധി ഉറവിടങ്ങളിൽ നിന്ന് കൂടുതൽ വിവരങ്ങൾ ശേഖരിക്കുന്നു.
സ്വന്തം പുസ്തകങ്ങൾ അപ്ലോഡ് ചെയ്യാൻ രചയിതാക്കളെ പ്രോത്സാഹിപ്പിക്കുന്നതിന്, ഗൂഗിൾ അവരുടെ വെബ്സൈറ്റിലേക്ക് നിരവധി പ്രത്യേകതകൾ ചേർത്തിട്ടുണ്ട്. രചയിതാക്കൾക്ക് അവരുടെ ഇബുക്ക് സൗജന്യമായി ഡൗൺലോഡ് ചെയ്യാൻ സന്ദർശകരെ അനുവദിക്കാം, അല്ലെങ്കിൽ അവർക്ക് അവരുടെ വാങ്ങൽ വില നിശ്ചയിക്കാം. അവർക്ക് വില അങ്ങോട്ടും ഇങ്ങോട്ടും മാറ്റാൻ കഴിയും, അതുവഴി അനുയോജ്യമാകുമ്പോഴെല്ലാം കിഴിവുകൾ വാഗ്ദാനം ചെയ്യുന്നു. കൂടാതെ, ഒരു പുസ്തകത്തിന്റെ രചയിതാവ് ഒരു ഐഎസ്ബിഎൻ, എൽസിസിഎൻ അല്ലെങ്കിൽ ഒഎൽഎൽസി റെക്കോർഡ് നമ്പർ ചേർക്കാൻ തിരഞ്ഞെടുക്കുകയാണെങ്കിൽ, അത് ഉൾപ്പെടുത്തുന്നതിനായി പുസ്തകത്തിന്റെ യുആർഎൽ അപ്ഡേറ്റ് ചെയ്യും. തുടർന്ന്, ലിങ്കിന്റെ ആങ്കറായി രചയിതാവിന് ഒരു നിർദ്ദിഷ്ട പേജ് സജ്ജമാക്കാൻ കഴിയും. ഈ ഓപ്ഷൻ അവരുടെ പുസ്തകം കൂടുതൽ എളുപ്പത്തിൽ കണ്ടെത്താവുന്നതാക്കുന്നു.
എൻഗ്രാം വ്യൂവർ
അവരുടെ പുസ്തക ശേഖരത്തിലുടനീളമുള്ള പദ ഉപയോഗത്തിന്റെ ആവൃത്തി ഗ്രാഫ് ചെയ്യുന്ന ഗൂഗിൾ ബുക്സുമായി ബന്ധിപ്പിച്ചിരിക്കുന്ന ഒരു സേവനമാണ് എൻഗ്രാം വ്യൂവർ. ചരിത്രകാരന്മാർക്കും ഭാഷാശാസ്ത്രജ്ഞർക്കും ഈ സേവനം പ്രധാനമാണ്, കാരണം കാലാകാലങ്ങളിലെ പദ ഉപയോഗത്തിലൂടെ മനുഷ്യ സംസ്കാരത്തിലേക്ക് ഒരു ഉൾക്കാഴ്ച നൽകാൻ ഇതിന് കഴിയും. പ്രോഗ്രാമിൽ ഉപയോഗിച്ചിരിക്കുന്ന മെറ്റാഡാറ്റയിലെ പിശകുകൾ കാരണം ഈ പ്രോഗ്രാം വിമർശനത്തിന് വിധേയമായിട്ടുണ്ട്.
ഉള്ളടക്ക പ്രശ്നങ്ങളും വിമർശനങ്ങളും
സ്കാൻ ചെയ്ത ഡാറ്റയിൽ പിശകുകളുള്ളതും അത്തരം പ്രശ്നങ്ങൾ പരിഹരിക്കപ്പെടാത്തതും കാരണം അച്ചടി അവസാനിച്ച സൃഷ്ടികൾ സംരക്ഷിക്കുക എന്ന അതിന്റെ പ്രഖ്യാപിത ലക്ഷ്യം അപകടത്തിലാണെന്ന വിമർശനം ഈ പ്രോജക്റ്റിന് ലഭിച്ചിട്ടുണ്ട്.
സ്കാനിംഗ് പിശകുകൾ
സ്കാനിംഗ് പ്രക്രിയ പിശകുകൾക്ക് വിധേയമാണ്. ഉദാഹരണത്തിന്, ചില പേജുകൾ വായിക്കാൻ കഴിയാത്തതോ തലകീഴായിട്ടോ അല്ലെങ്കിൽ തെറ്റായ ക്രമത്തിലോ ആയിരിക്കാം. തകർന്ന പേജുകൾ, മങ്ങിയ ചിത്രങ്ങൾ, വിരലുകൾ എന്നിവ പോലും പണ്ഡിതന്മാർ റിപ്പോർട്ട് ചെയ്തിട്ടുണ്ട്. ഈ വിഷയത്തിന്റെ ഭാഗമായി സ്കാൻ ചെയ്ത പുസ്തകങ്ങളുടെ അവസാനം ഗൂഗിൾ ഇങ്ങനെ പറയുന്നു:
“
The digitization at the most basic level is based on page images of the physical books. To make this book available as an ePub formatted file we have taken those page images and extracted the text using Optical Character Recognition (or OCR for short) technology. The extraction of text from page images is a difficult engineering task. Smudges on the physical books' pages, fancy fonts, old fonts, torn pages, etc. can all lead to errors in the extracted text. Imperfect OCR is only the first challenge in the ultimate goal of moving from collections of page images to extracted-text based books. Our computer algorithms also have to automatically determine the structure of the book (what are the headers and footers, where images are placed, whether text is verse or prose, and so forth).
Getting this right allows us to render the book in a way that follows the format of the original book. Despite our best efforts you may see spelling mistakes, garbage characters, extraneous images, or missing pages in this book. Based on our estimates, these errors should not prevent you from enjoying the content of the book. The technical challenges of automatically constructing a perfect book are daunting, but we continue to make enhancements to our OCR and book structure extraction technologies.
(ഏകദേശ അർഥം- ഏറ്റവും അടിസ്ഥാന തലത്തിലുള്ള ഡിജിറ്റൈസേഷൻ ഫിസിക്കൽ ബുക്കുകളുടെ പേജ് ഇമേജുകളെ അടിസ്ഥാനമാക്കിയുള്ളതാണ്. ഈ പുസ്തകം ഇപബ് ഫോർമാറ്റ് ഫയലായി ലഭ്യമാക്കുന്നതിന് ഞങ്ങൾ പേജ് ഇമേജ് എടുത്ത് ഒപ്റ്റിക്കൽ ക്യാരക്ടർ റെക്കഗ്നിഷൻ (അല്ലെങ്കിൽ ചുരുക്കത്തിൽ ഓസിആർ) സാങ്കേതികവിദ്യ ഉപയോഗിച്ച് ടെക്സ്റ്റ് എക്സ്ട്രാക്റ്റ് ചെയ്യുന്നു. പേജ് ചിത്രങ്ങളിൽ നിന്ന് വാചകം വേർതിരിച്ചെടുക്കുന്നത് ബുദ്ധിമുട്ടുള്ള ഒരു എഞ്ചിനീയറിംഗ് ജോലിയാണ്. ഫിസിക്കൽ ബുക്കുകളുടെ പേജുകൾ, ഫാൻസി ഫോണ്ടുകൾ, പഴയ ഫോണ്ടുകൾ, കീറിപ്പോയ പേജുകൾ മുതലായവയിലെ സ്മഡ്ജുകൾ എക്സ്ട്രാക്റ്റുചെയ്ത വാചകത്തിലെ പിശകുകളിലേക്ക് നയിച്ചേക്കാം. പേജ് ചിത്രങ്ങളുടെ ശേഖരത്തിൽ നിന്ന് എക്സ്ട്രാക്റ്റ് ചെയ്ത ടെക്സ്റ്റ് അധിഷ്ഠിത പുസ്തകങ്ങളിലേക്ക് മാറുക എന്ന ആത്യന്തിക ലക്ഷ്യത്തിലെ ആദ്യ വെല്ലുവിളി മാത്രമാണ് അപൂർണ്ണമായ ഓസിആർ. ഞങ്ങളുടെ കമ്പ്യൂട്ടർ അൽഗോരിതങ്ങൾ പുസ്തകത്തിന്റെ ഘടന സ്വയമേവ നിർണ്ണയിക്കേണ്ടതുണ്ട് (തലക്കെട്ടുകളും അടിക്കുറിപ്പുകളും എന്തൊക്കെയാണ്, എവിടെയാണ് ചിത്രങ്ങൾ സ്ഥാപിച്ചിരിക്കുന്നത്, പദ്യമോ ഗദ്യമോ മുതലായവ).
ഇത് ശരിയാക്കുന്നത്, യഥാർത്ഥ പുസ്തകത്തിന്റെ ഫോർമാറ്റ് പിന്തുടരുന്ന രീതിയിൽ പുസ്തകം റെൻഡർ ചെയ്യാൻ ഞങ്ങളെ അനുവദിക്കുന്നു. ഞങ്ങൾ പരമാവധി ശ്രമിച്ചിട്ടും ഈ പുസ്തകത്തിൽ അക്ഷരപ്പിശകുകൾ, മാലിന്യ പ്രതീകങ്ങൾ, ബാഹ്യമായ ചിത്രങ്ങൾ, അല്ലെങ്കിൽ കാണാത്ത പേജുകൾ എന്നിവ നിങ്ങൾ കണ്ടേക്കാം. ഞങ്ങളുടെ അനുമാനങ്ങളെ അടിസ്ഥാനമാക്കി, ഈ പിശകുകൾ പുസ്തകത്തിന്റെ ഉള്ളടക്കം ആസ്വദിക്കുന്നതിൽ നിന്ന് നിങ്ങളെ തടയരുത്. ഒരു മികച്ച പുസ്തകം നിർമ്മിക്കുന്നതിനുള്ള സാങ്കേതിക വെല്ലുവിളികൾ വലുതാണ്, എന്നാൽ ഞങ്ങളുടെ ഓസിആർ, പുസ്തക ഘടന വേർതിരിച്ചെടുക്കൽ സാങ്കേതികവിദ്യകളിൽ ഞങ്ങൾ മെച്ചപ്പെടുത്തലുകൾ തുടരുകയാണ്.)
”
2009-ലെ കണക്കനുസരിച്ച്, ഗൂഗിൾ ബുക്ക് സ്കാനുകളിൽ കണ്ടെത്തിയ പിശകുകൾ പരിഹരിക്കാൻ സഹായിക്കുന്നതിന് അവർ reCAPTCHA ഉപയോഗിച്ച് തുടങ്ങുമെന്ന് ഗൂഗിൾ പ്രസ്താവിച്ചു. സ്കാനിംഗ് പ്രക്രിയ കാരണം തിരിച്ചറിയാൻ പ്രയാസമുള്ള സ്കാൻ ചെയ്ത പദങ്ങൾ മാത്രമേ ഈ രീതി മെച്ചപ്പെടുത്തൂ, അല്ലാതെ തലതിരിഞ്ഞ പേജുകൾ അല്ലെങ്കിൽ തടഞ്ഞ വാക്കുകൾ പോലുള്ള പിശകുകൾ പരിഹരിക്കാൻ ഇതിന് കഴിയില്ല.
മെറ്റാഡാറ്റയിലെ പിശകുകൾ
ഗൂഗിൾ ബുക്സിലെ മെറ്റാഡാറ്റ വിവരങ്ങളിൽ, രചയിതാക്കളുടെ പേര് തെറ്റായി നല്കിയതും തെറ്റായ പ്രസിദ്ധീകരണ തീയതികളും ഉൾപ്പെടെ വ്യാപകമായ പിശകുകൾ റിപ്പോർട്ട് ചെയ്തിട്ടുണ്ട്. കാലക്രമേണ വാക്കുകളുടെ ഉപയോഗത്തിലെ മാറ്റങ്ങളെക്കുറിച്ച് ഗവേഷണം നടത്തുന്ന ഭാഷാശാസ്ത്രജ്ഞനായ ജെഫ്രി നൻബെർഗ് 1950-ന് മുമ്പ് പ്രസിദ്ധീകരിച്ചതും "ഇന്റർനെറ്റ്" എന്ന വാക്ക് അടങ്ങിയതുമായ പുസ്തകങ്ങൾക്കായി നടത്തിയ തിരച്ചിലിൽ 527 ഫലങ്ങൾ ലഭിച്ചതായി ശ്രദ്ധിച്ചു. വുഡി അലൻ ജനിക്കുന്നതിന് മുമ്പ് പ്രസിദ്ധീകരിച്ച 325 പുസ്തകങ്ങളിൽ ആ പേര് പരാമർശിക്കപ്പെട്ടിട്ടുണ്ട്. ഭൂരിഭാഗം പിശകുകളും പുറത്തുനിന്നുള്ള കരാറുകാരുടെ ഭാഗത്ത് നിന്ന് ഉണ്ടായതാണെന്ന് കുറ്റപ്പെടുത്തിക്കൊണ്ടാണ് ഗൂഗിൾ നൻബെർഗിനോട് പ്രതികരിച്ചത്.
റിപ്പോർട്ടുചെയ്ത മറ്റ് മെറ്റാഡാറ്റ പിശകുകളിൽ രചയിതാവിന്റെ ജനനത്തിനു മുമ്പുള്ള പ്രസിദ്ധീകരണ തീയതികള് (ഉദാ. ചാൾസ് ഡിക്കൻസിന്റെ ജനനത്തിനു മുമ്പുള്ള 182 കൃതികൾ); തെറ്റായ വിഷയ വർഗ്ഗീകരണങ്ങൾ ("കമ്പ്യൂട്ടറുകൾ" എന്നതിന് കീഴിൽ കണ്ടെത്തിയ മോബി ഡിക്കിന്റെ ഒരു പുസ്തകം, "മതം" എന്നതിന് കീഴിൽ തരംതിരിക്കപ്പെട്ട മേ വെസ്റ്റിന്റെ ജീവചരിത്രം), വൈരുദ്ധ്യമുള്ള വർഗ്ഗീകരണങ്ങൾ, തെറ്റായി എഴുതിയ ശീർഷകങ്ങൾ, രചയിതാക്കൾ, പ്രസാധകർ, കൂടാതെ ഒരു പുസ്തകത്തിന്റെ മെറ്റാഡാറ്റ തികച്ചും വ്യത്യസ്തമായ ഒരു പുസ്തകത്തിൽ തെറ്റായി ചേർത്തിരിക്കുന്നു (1818 ലെ ഒരു ഗണിതശാസ്ത്ര സൃഷ്ടിയുടെ മെറ്റാഡാറ്റ 1963 ലെ പ്രണയ നോവലിലേക്ക് നയിക്കുന്നു) എന്നതുപോലെ നിരവധി പിശകുകൾ ഉണ്ട്.
ക്രമരഹിതമായി തിരഞ്ഞെടുത്ത 400 ഗൂഗിൾ ബുക്കുകളിലെ, രചയിതാവ്, ശീർഷകം, പ്രസാധകൻ, പ്രസിദ്ധീകരണ വർഷം തുടങ്ങിയ മെറ്റാഡാറ്റ ഘടകങ്ങളുടെ പിശക് കണ്ടെത്തുന്നതിനുള്ള ഒരു അവലോകനം നടത്തി. ഡിജിറ്റൈസേഷൻ പ്രോജക്റ്റിലെ 36% സാമ്പിൾ ബുക്കുകളിലും മെറ്റാഡാറ്റ പിശകുകൾ അടങ്ങിയിട്ടുണ്ടെന്ന് ഫലങ്ങൾ കാണിക്കുന്നു. ഒരു സാധാരണ ലൈബ്രറി ഓൺലൈൻ കാറ്റലോഗിൽ ഒരാൾ പ്രതീക്ഷിക്കുന്നതിനേക്കാൾ കൂടുതലാണ് ഈ പിശക് നിരക്ക്.
ഈ പഠനത്തിൽ കണ്ടെത്തിയ 36.75% എന്ന മൊത്തത്തിലുള്ള പിശക് നിരക്ക്, ഗൂഗിൾ ബുക്സിന്റെ മെറ്റാഡാറ്റയിൽ ഉയർന്ന പിശക് നിരക്ക് ഉണ്ടെന്ന് സൂചിപ്പിക്കുന്നു. ഈ പഠനത്തിൽ പരിശോധിച്ച നാല് മെറ്റാഡാറ്റ ഘടകങ്ങളിൽ കണ്ടെത്തിയ പിശകുകൾ എല്ലാം പ്രധാനമായി കണക്കാക്കണം.
തെറ്റായ സ്കാൻ ചെയ്ത തീയതികളെ അടിസ്ഥാനമാക്കിയുള്ള മെറ്റാഡാറ്റ പിശകുകൾ ഗൂഗിൾ ബുക്സ് പ്രോജക്ട് ഡാറ്റാബേസ് ഉപയോഗിച്ചുള്ള ഗവേഷണം ബുദ്ധിമുട്ടാക്കുന്നു. ഈ പിശകുകൾ മായ്ക്കുന്നതിൽ ഗൂഗിൾ പരിമിതമായ താൽപ്പര്യം മാത്രമേ കാണിച്ചിട്ടുള്ളൂ.
ഭാഷാ പ്രശ്നങ്ങൾ
ചില യൂറോപ്യൻ രാഷ്ട്രീയക്കാരും ബുദ്ധിജീവികളും ഭാഷാപരമായ അടിസ്ഥാനത്തിൽ ഗൂഗിളിന്റെ ശ്രമത്തെ വിമർശിച്ചിട്ടുണ്ട്. സ്കാൻ ചെയ്യാൻ നിർദ്ദേശിച്ചിരിക്കുന്ന പുസ്തകങ്ങളിൽ ഭൂരിഭാഗവും ഇംഗ്ലീഷിലുള്ളതിനാൽ, അത് ഡിജിറ്റൽ ലോകത്ത് മറ്റ് ഭാഷകളുമായി താരതമ്യ പ്പെടുത്തുമ്പോൾ ഇംഗ്ലീഷിന് ആനുപാതികമല്ലാത്ത പ്രാതിനിധ്യത്തിന് കാരണമാകുമെന്ന് അവർ വാദിക്കുന്നു. ഉദാഹരണത്തിന്, ജർമ്മൻ, റഷ്യൻ, ഫ്രഞ്ച്, സ്പാനിഷ് എന്നിവ സ്കോളർഷിപ്പിൽ ജനപ്രിയ ഭാഷകളാണ്. എന്നിരുന്നാലും, ഇംഗ്ലീഷിനുള്ള ആനുപാതികമല്ലാത്ത ഓൺലൈൻ ഊന്നൽ സ്കോളർഷിപ്പിലേക്കുള്ള പ്രവേശനത്തെയും ആത്യന്തികമായി, ഭാവിയിലെ സ്കോളർഷിപ്പിന്റെ വളർച്ചയെയും ബാധിക്കും. ഈ വിമർശകരിൽ Bibliothèque nationale de France മുൻ പ്രസിഡന്റ് ജീൻ-നോയൽ ജീനെനി ഉൾപ്പെടുന്നു.
ഗൂഗിൾ ബുക്സും ഗൂഗിൾ സ്കോളറും
ഗൂഗിൾ ബുക്സ് ധാരാളം ജേണൽ ബാക്ക് ലക്കങ്ങൾ ഡിജിറ്റൈസ് ചെയ്തിട്ടുണ്ടെങ്കിലും, അതിന്റെ സ്കാനുകളിൽ നിർദ്ദിഷ്ട ലക്കങ്ങളിലെ പ്രത്യേക ലേഖനങ്ങൾ തിരിച്ചറിയുന്നതിന് ആവശ്യമായ മെറ്റാഡാറ്റ ഉൾപ്പെടുന്നില്ല. ഇത് പഴയ ജേണൽ ലേഖനങ്ങൾ (അവരുടെ പ്രസാധകരുമായി ധാരണയിൽ) ഡിജിറ്റൈസ് ചെയ്യുന്നതിനും ഹോസ്റ്റുചെയ്യുന്നതിനുമുള്ള സ്വന്തം പ്രോഗ്രാം നിർമ്മിക്കാൻ ഗൂഗിൾ സ്കോളർ നിർമ്മാതാക്കളെ പ്രേരിപ്പിച്ചു.
ലൈബ്രറി പങ്കാളികൾ
ഗൂഗിൾ ബുക്സ് ലൈബ്രറി പ്രോജക്റ്റ് നിരവധി പ്രധാന ഗവേഷണ ലൈബ്രറികളുടെ ശേഖരങ്ങൾ സ്കാൻ ചെയ്യാനും തിരയാനും ലക്ഷ്യമിടുന്നു. ഗ്രന്ഥസൂചിക വിവരങ്ങളോടൊപ്പം, ഒരു പുസ്തകത്തിൽ നിന്നുള്ള വാചകത്തിന്റെ സ്നിപ്പെറ്റുകൾ പലപ്പോഴും കാണാൻ കഴിയും. ഒരു പുസ്തകം പകർപ്പവകാശത്തിന് പുറത്തുള്ളതും പൊതുസഞ്ചയത്തിലുമാണെങ്കിൽ, പുസ്തകം പൂർണ്ണമായി വായിക്കാനോ ഡൗൺലോഡ് ചെയ്യാനോ ലഭ്യമാവും.
ലൈബ്രറി പ്രോജക്റ്റിലൂടെ സ്കാൻ ചെയ്ത പകർപ്പവകാശമുള്ള പുസ്തകങ്ങളുടെ സ്നിപ്പറ്റ് കാഴ്ച മാത്രമാണ് ഗൂഗിൾ ബുക്സിൽ ലഭ്യമാവുക. സ്കാനുകളുടെ ഗുണനിലവാരം സംബന്ധിച്ച്, ഗൂഗിൾ പ്ലേയിൽ വിൽപ്പനയ്ക്കായി നല്കുമ്പോൾ അവ "വേണ്ടത്ര ഉയർന്ന നിലവാരമുള്ളതാകണമെന്നില്ല" എന്ന് ഗൂഗിൾ സാക്ഷ്യപ്പെടുത്തുന്നു. കൂടാതെ, കരുതപ്പെടുന്ന സാങ്കേതിക പരിമിതികൾ കാരണം, പ്രസാധകർ നൽകിയേക്കാവുന്ന ഉയർന്ന നിലവാരമുള്ള പതിപ്പുകൾ ഉപയോഗിച്ച് ഗൂഗിൾ സ്കാനുകൾ മാറ്റിസ്ഥാപിക്കുന്നില്ല.
ഈ പ്രൊജക്റ്റ് 2005 ൽ ഓതേഴ്സ് ഗിൽഡ് വി. ഗൂഗിൾ എന്ന കോടതി കേസ് ആകുകയും, കേസിൻമേൽ 2013-ൽ ഗൂഗിളിന് അനുകൂലമായി വിധിക്കുകയും ചെയ്തു, വീണ്ടും അപ്പീലിൽ, 2015-ലും വിധി ഗൂഗിളിന് അനുകൂലമായിരുന്നു.
പകർപ്പവകാശമുള്ള ഉടമകൾക്ക് സ്കാൻ ചെയ്ത ഒരു പുസ്തകത്തിന്റെ അവകാശങ്ങൾ ക്ലെയിം ചെയ്ത് അത് പ്രിവ്യൂവിനോ പൂർണ്ണമായ കാഴ്ചയ്ക്കോ ലഭ്യമാക്കാം (അത് അവരുടെ പാർട്ട്ണർ പ്രോഗ്രാം അക്കൗണ്ടിലേക്ക് "കൈമാറിക്കൊണ്ട്"), അല്ലെങ്കിൽ പുസ്തകത്തിലുള്ള വാചകം കാണിക്കുന്നത് തടയാൻ ഗൂഗിളിനോട് അഭ്യർത്ഥിക്കാം.
ലൈബ്രറി പ്രോജക്ട് പദ്ധതിയിൽ പങ്കെടുക്കുന്ന സ്ഥാപനങ്ങളുടെ എണ്ണം അതിന്റെ തുടക്കം മുതൽ വർദ്ധിച്ചുവരുന്നു.
ഹാർവാർഡ് യൂണിവേഴ്സിറ്റി ലൈബ്രറിയും ഗൂഗിളും 2005-ൽ 15.8 ദശലക്ഷത്തിലധികം വാല്യങ്ങൾ ഉൾക്കൊള്ളുന്ന ഹാർവാർഡ് യൂണിവേഴ്സിറ്റി ലൈബ്രറിയുടെ ഹോൾഡിംഗുകളിലേക്കുള്ള ഓൺലൈൻ പ്രവേശനം വർദ്ധിപ്പിക്കുക എന്ന ലക്ഷ്യത്തോടെ ഹാർവാർഡ്-ഗൂഗിൾ പ്രോജക്റ്റ് എന്ന ഒരു പദ്ധതി പരീക്ഷിച്ചു. ഹാർവാർഡിന്റെ ലൈബ്രറി മെറ്റീരിയലുകളിലേക്കുള്ള ഭൗതിക പ്രവേശനം പൊതുവെ നിലവിലുള്ള ഹാർവാർഡ് വിദ്യാർത്ഥികൾക്കും അധ്യാപകർക്കും ഗവേഷകർക്കും കേംബ്രിഡ്ജിൽ വരാൻ കഴിയുന്ന പണ്ഡിതന്മാർക്കും മാത്രമായി പരിമിതപ്പെടുത്തിയിരിക്കുമ്പോൾ, ഹാർവാർഡ് കമ്മ്യൂണിറ്റിയിലെ അംഗങ്ങൾക്കും അതല്ലാതെ എല്ലായിടത്തും ഉള്ള ഉപയോക്താക്കൾക്കും വിവരങ്ങൾ കണ്ടെത്താൻ കഴിയുന്ന തരത്തിലാണ് ഹാർവാർഡ്-ഗൂഗിൾ പ്രോജക്റ്റ് രൂപകൽപ്പന ചെയ്തിരിക്കുന്നത്.
ഈ പൈലറ്റ് പ്രോഗ്രാമിൽ, ന്യൂയോർക്ക് പബ്ലിക് ലൈബ്രറി അതിന്റെ പൊതു സഞ്ചയത്തിലുള്ള പുസ്തകങ്ങളുടെ ഒരു ശേഖരം ഗൂഗിളിന്റെ സഹകരണത്തോടെ അവ മുഴുവനായും സ്കാൻ ചെയ്ത് ഓൺലൈനിൽ പൊതുജനങ്ങൾക്ക് സൗജന്യമായി ലഭ്യമാക്കുന്നതിനായി ഗൂഗിളുമായി ചേർന്ന് പ്രവർത്തിക്കുന്നു. ഉപയോക്താക്കൾക്ക് ഈ കൃതികളുടെ മുഴുവൻ വാചകവും തിരയാനും ബ്രൗസ് ചെയ്യാനും കഴിയും. സ്കാനിംഗ് പ്രക്രിയ പൂർത്തിയാകുമ്പോൾ, ന്യൂയോർക്ക് പബ്ലിക് ലൈബ്രറിയുടെ വെബ്സൈറ്റിൽ നിന്നും ഗൂഗിൾ സെർച്ച് എഞ്ചിനിൽ നിന്നും പുസ്തകങ്ങൾ ആക്സസ് ചെയ്യാവുന്നതാണ്.
യൂണിവേഴ്സിറ്റി ഓഫ് വിസ്കോൺസിൻ–മാഡിസൺ, യൂണിവേഴ്സിറ്റി ഓഫ് വിസ്കോൺസിൻ ലൈബ്രറികൾ
2012 മാർച്ച് വരെ ഏകദേശം 600,000 വാല്യങ്ങൾ സ്കാൻ ചെയ്തു.
ചരിത്രം
2002: ഗൂഗിളിലെ ഒരു കൂട്ടം ടീം അംഗങ്ങൾ "സീക്രട്ട് ബുക്സ് പ്രോജക്ട്' പദ്ധതി ഔദ്യോഗികമായി സമാരംഭിച്ചു. ഗൂഗിൾ സ്ഥാപകരായ സെർജി ബ്രിനുംലാറി പേജും 1996-ൽ സ്റ്റാൻഫോർഡിലെ ബിരുദ വിദ്യാർത്ഥികളായിരിക്കെ തന്നെ ഗൂഗിൾ ബുക്സായി മാറിയ ആശയം മുന്നോട്ടുവച്ചിരുന്നു. അവ എങ്ങനെ പ്രവർത്തിക്കുന്നു എന്നറിയാൻ, ലൈബ്രറി ഓഫ് കോൺഗ്രസിന്റെ അമേരിക്കൻ മെമ്മറി പ്രോജക്റ്റ്, പ്രോജക്റ്റ് ഗുട്ടൻബർഗ്, യൂണിവേഴ്സൽ ലൈബ്രറി എന്നിവയുൾപ്പെടെ അക്കാലത്തെ ചില വലിയ ഡിജിറ്റലൈസേഷൻ ശ്രമങ്ങളുടെ സൈറ്റുകൾ ഈ സംഘം സന്ദർശിച്ചു. അക്കാലത്തെ യൂണിവേഴ്സിറ്റി പ്രസിഡണ്ട് മേരി സ്യൂ കോൾമാനുമായുള്ള ഒരു സംഭാഷണത്തിൽ, ലൈബ്രറിയുടെ എല്ലാ വാല്യങ്ങളും സ്കാൻ ചെയ്യുന്നതിനുള്ള സർവകലാശാലയുടെ നിലവിലെ എസ്റ്റിമേറ്റ് 1,000 വർഷമാണെന്ന് ലാറി പേജ് കണ്ടെത്തിയപ്പോൾ, "ആറ് വർഷത്തിനുള്ളിൽ ഗൂഗിൾ ഇത് സാധ്യമാക്കുമെന്ന് താൻ വിശ്വസിക്കുന്നുവെന്ന് പേജ് കോൾമാനോട് പറഞ്ഞു."
2003: ഒരു ഹൈ-സ്പീഡ് സ്കാനിംഗ് പ്രക്രിയയും പ്രശ്നങ്ങൾ പരിഹരിക്കുന്നതിനുള്ള സോഫ്റ്റ്വെയറും വികസിപ്പിക്കാൻ ടീം പ്രവർത്തിക്കാൻ തുടങ്ങുന്നു.
ഡിസംബർ 2004: ഗൂഗിൾ പ്രിന്റ് ലൈബ്രറി പ്രൊജക്റ്റ് എന്നറിയപ്പെടുന്ന ഗൂഗിൾ പ്രിന്റ് സംരംഭത്തിനു ഒരു വിപുലീകരണമുണ്ടാകുമെന്ന സൂചന ഗൂഗിൾ നൽകി.യൂണിവേഴ്സിറ്റി ഓഫ് മിഷിഗൺ, ഹാർവാർഡ് (ഹാർവാർഡ് യൂണിവേഴ്സിറ്റി ലൈബ്രറി), സ്റ്റാൻഫോർഡ് (ഗ്രീൻ ലൈബ്രറി), ഓക്സ്ഫോർഡ് (ബോഡ്ലിയൻ ലൈബ്രറി), ന്യൂയോർക്ക് പബ്ലിക് ലൈബ്രറി എന്നിവയുൾപ്പെടെ നിരവധി ഉന്നത സർവകലാശാലകളുമായും പൊതു ലൈബ്രറികളുമായും ഗൂഗിൾ പങ്കാളിത്തം പ്രഖ്യാപിച്ചു. പ്രസ് റിലീസുകളും യൂണിവേഴ്സിറ്റി ലൈബ്രേറിയന്മാരും പറയുന്നതനുസരിച്ച്, ഗൂഗിൾ ഒരു ദശകത്തിനുള്ളിൽ ഏകദേശം 15 ദശലക്ഷം വാല്യങ്ങൾ ഡിജിറ്റൈസ് ചെയ്യാനും ലഭ്യമാക്കാനും പദ്ധതിയിട്ടിരുന്നു. പബ്ലിക് ഡൊമെയ്നിലെ പുസ്തകങ്ങൾ മാത്രമല്ല, ഇപ്പോഴും പകർപ്പവകാശത്തിന് കീഴിലുള്ളവയും ഡിജിറ്റൈസ് ചെയ്യാനുള്ള ഗൂഗിളിന്റെ പദ്ധതി പ്രസാധകരുടെയും രചയിതാക്കളുടെയും അസോസിയേഷനുകൾ വെല്ലുവിളിച്ചതിനാൽ ഈ പ്രഖ്യാപനം ഉടൻ വിവാദത്തിന് കാരണമായി.
സെപ്റ്റംബർ-ഒക്ടോബർ 2005: കമ്പനി പകർപ്പവകാശത്തെ മാനിച്ചിട്ടില്ലെന്നും രചയിതാക്കൾക്കും പ്രസാധകർക്കും ശരിയായ നഷ്ടപരിഹാരം നൽകുന്നതിൽ പരാജയപ്പെട്ടുവെന്നും കാണിച്ച് ഗൂഗിളിനെതിരെ രണ്ട് കേസുകൾ ചുമത്തി. ഓതേഴ്സ് ഗിൽഡിന് വേണ്ടിയുള്ള ഒരു ക്ലാസ് ആക്ഷൻ സ്യൂട്ടാണ് ഒന്ന് (ഓതേഴ്സ് ഗിൽഡ് വി. ഗൂഗിൾ, സെപ്തംബർ 20, 2005) അഞ്ച് വലിയ പ്രസാധകരും അസോസിയേഷൻ ഓഫ് അമേരിക്കൻ പബ്ലിഷേഴ്സും ചേർന്ന് കൊണ്ടുവന്ന ഒരു സിവിൽ വ്യവഹാരമാണ് (മക്ഗ്രോ ഹിൽ വി. ഗൂഗിൾ, ഒക്ടോബർ 19, 2005) മറ്റൊന്ന്.
നവംബർ 2005: ഗൂഗിൾ ഈ സേവനത്തിന്റെ പേര് ഗൂഗിൾ പ്രിന്റിൽ നിന്ന് ഗൂഗിൾ ബുക്ക് സെർച്ച് എന്നാക്കി മാറ്റി. പ്രസാധകരെയും രചയിതാക്കളെയും അവരുടെ പുസ്തകങ്ങളെ സേവനത്തിൽ ഉൾപ്പെടുത്താൻ പ്രാപ്തരാക്കുന്ന അതിന്റെ പ്രോഗ്രാം ഗൂഗിൾ ബുക്സ് പാർട്ണർ പ്രോഗ്രാം എന്ന് പുനർനാമകരണം ചെയ്യപ്പെട്ടു, ലൈബ്രറികളുമായുള്ള പങ്കാളിത്തം ഗൂഗിൾ ബുക്സ് ലൈബ്രറി പ്രോജക്ടായി മാറി.
2006: ഗൂഗിൾ അതിന്റെ എല്ലാ പകർപ്പവകാശത്തിന് പുറത്തുള്ള, പൊതു സഞ്ചയ പുസ്തകങ്ങളിലും "ഒരു പിഡിഎഫ് ഡൗൺലോഡ്" ബട്ടൺ ചേർത്തു. ഒപ്പം "അബൌട്ട് ദിസ് ബുക്ക്" പേജുകൾക്കൊപ്പം ഒരു പുതിയ ബ്രൗസിംഗ് ഇന്റർഫേസും ചേർത്തു.
ഓഗസ്റ്റ് 2006: ബുക്സ് ഡിജിറ്റൈസേഷൻ പദ്ധതിയിൽ ചേരുമെന്ന് കാലിഫോർണിയ യൂണിവേഴ്സിറ്റി സിസ്റ്റം പ്രഖ്യാപിച്ചു. ഇതിൽ സിസ്റ്റം നിയന്ത്രിക്കുന്ന ഏകദേശം 100 ലൈബ്രറികൾക്കുള്ളിൽ വരുന്ന 34 ദശലക്ഷം വാല്യത്തിന്റെ ഒരു ഭാഗം ഉൾപ്പെടുന്നു.
ഒക്ടോബർ 2006: വിസ്കോൺസിൻ-മാഡിസൺ യൂണിവേഴ്സിറ്റി, വിസ്കോൺസിൻ ഹിസ്റ്റോറിക്കൽ സൊസൈറ്റി ലൈബ്രറിയോടൊപ്പം ബുക്ക് സെർച്ച് ഡിജിറ്റൈസേഷൻ പദ്ധതിയിൽ ചേരുമെന്ന് പ്രഖ്യാപിച്ചു. സംയോജിതമായി, ലൈബ്രറികൾക്ക് 7.2 ദശലക്ഷം ഹോൾഡിംഗ്സ് ഉണ്ട്.
നവംബർ 2006: യൂണിവേഴ്സിറ്റി ഓഫ് വെർജീനിയ പദ്ധതിയിൽ ചേർന്നു. അതിന്റെ ലൈബ്രറികളിൽ അഞ്ച് ദശലക്ഷത്തിലധികം വാല്യങ്ങളും 17-ദശലക്ഷത്തിലധികം കൈയെഴുത്തുപ്രതികളും അപൂർവ പുസ്തകങ്ങളും ആർക്കൈവുകളും ഉണ്ട്.
ജനുവരി 2007: ഓസ്റ്റിനിലെ ടെക്സാസ് യൂണിവേഴ്സിറ്റി ബുക്ക് സെർച്ച് ഡിജിറ്റൈസേഷൻ പദ്ധതിയിൽ ചേരുമെന്ന് പ്രഖ്യാപിച്ചു. യൂണിവേഴ്സിറ്റിയുടെ 13 ലൈബ്രറി ലൊക്കേഷനുകളിൽ നിന്ന് കുറഞ്ഞത് ഒരു ദശലക്ഷം വാല്യങ്ങൾ ഡിജിറ്റൈസ് ചെയ്യും എന്നും പ്രഖ്യാപിച്ചു.
മാർച്ച് 2007: ജർമ്മൻ, ഫ്രഞ്ച്, ഇറ്റാലിയൻ, ലാറ്റിൻ, സ്പാനിഷ് ഭാഷകളിൽ ഒരു ദശലക്ഷത്തിലധികം പൊതു സഞ്ചയ പുസ്തകങ്ങളും ഔട്ട് ഓഫ് പ്രിന്റ് വർക്കുകളും സ്കാൻ ചെയ്യുന്നതിനായി ബവേറിയൻ സ്റ്റേറ്റ് ലൈബ്രറി ഗൂഗിളുമായി ഒരു പങ്കാളിത്തം പ്രഖ്യാപിച്ചു.
മെയ് 2007: ഫ്രഞ്ച്, ഡച്ച് ഭാഷകളിലുള്ള 19-ആം നൂറ്റാണ്ടിലെ പുസ്തകങ്ങൾ ഡിജിറ്റൈസ് ചെയ്യുന്നതിനും ഡിജിറ്റൈസ് ചെയ്ത പതിപ്പുകൾ ഓൺലൈനിൽ ലഭ്യമാക്കുന്നതിനും ഗൂഗിളിനൊപ്പം പങ്കെടുക്കുമെന്ന് ഗെന്റ് യൂണിവേഴ്സിറ്റിയിലെ ബോകെൻറോറൻ ലൈബ്രറി പ്രഖ്യാപിച്ചു.
മെയ് 2007: കടലാസിലും താളിയോലയിലും ആയി സംസ്കൃതത്തിലോ കന്നഡയിലോ എഴുതിയ ഏകദേശം 100,000 കയ്യെഴുത്തുപ്രതികൾ ഉൾപ്പെടെ 800,000-ലധികം പുസ്തകങ്ങളും കൈയെഴുത്തുപ്രതികളും ഗൂഗിളുമായി ചേർന്ന് ഡിജിറ്റൈസ് ചെയ്യുമെന്ന് മൈസൂർ സർവകലാശാല പ്രഖ്യാപിച്ചു.
ജൂൺ 2007: ഇൻസ്റ്റിറ്റ്യൂഷണൽ കോ-ഓപ്പറേഷൻ കമ്മിറ്റി (2016-ൽ ബിഗ് ടെൻ അക്കാദമിക് അലയൻസ് എന്ന് പുനർനാമകരണം ചെയ്യപ്പെട്ടു) അതിന്റെ പന്ത്രണ്ട് അംഗ ലൈബ്രറികൾ അടുത്ത ആറ് വർഷത്തിനുള്ളിൽ 10 ദശലക്ഷം പുസ്തകങ്ങൾ 10 സ്കാൻ ചെയ്യുമെന്ന് പ്രഖ്യാപിച്ചു.
ജൂലൈ 2007: 120,000 പൊതു സഞ്ചയ പുസ്തകങ്ങളെങ്കിലും ഡിജിറ്റൈസ് ചെയ്യുമെന്ന പ്രഖ്യാപനത്തോടെ കിയോ യൂണിവേഴ്സിറ്റി ജപ്പാനിലെ ഗൂഗിളിന്റെ ആദ്യ ലൈബ്രറി പങ്കാളിയായി.
ഓഗസ്റ്റ് 2007: കോർണെൽ യൂണിവേഴ്സിറ്റി ലൈബ്രറിയിൽ നിന്ന് പകർപ്പവകാശമുള്ളതും ഇല്ലാത്തതുമായ 500,000 ഓളം പുസ്തകങ്ങൾ ഡിജിറ്റൈസ് ചെയ്യുമെന്ന് ഗൂഗിൾ പ്രഖ്യാപിച്ചു. സർവ്വകലാശാലയുടെ സ്വന്തം ലൈബ്രറി സിസ്റ്റത്തിൽ ഉൾപ്പെടുത്തുന്നതിനായി സ്കാൻ ചെയ്ത എല്ലാ സൃഷ്ടികളുടെയും ഡിജിറ്റൽ പകർപ്പും ഗൂഗിൾ നൽകും.
സെപ്റ്റംബർ 2007: പൊതുസഞ്ചയത്തിലുള്ള പുസ്തകങ്ങളുടെ സ്നിപ്പെറ്റുകൾ പങ്കിടാൻ ഉപയോക്താക്കളെ അനുവദിക്കുന്ന ഒരു ഫീച്ചർ ഗൂഗിൾ ചേർത്തു. സ്നിപ്പെറ്റുകൾ പുസ്തകത്തിന്റെ സ്കാൻ പോലെ അല്ലെങ്കിൽ പ്ലെയിൻ ടെക്സ്റ്റായി ദൃശ്യമാകാം.
സെപ്തംബർ 2007: ഗൂഗിൾ "മൈ ലൈബ്രറി" എന്ന പേരിൽ ഒരു പുതിയ ഫീച്ചർ അവതരിപ്പിച്ചു, അത് വ്യക്തിഗതമായ പുസ്തക ശേഖരങ്ങൾ ലേബൽ ചെയ്യാനോ അവലോകനം ചെയ്യാനോ റേറ്റുചെയ്യാനോ പൂർണ്ണമായ വാചകം തിരയാനോ ഉപയോക്താക്കളെ അനുവദിക്കുന്നു.
ഡിസംബർ 2007: പൊതു സഞ്ചയ വർക്കുകൾ ഡിജിറ്റൈസ് ചെയ്യുന്നതിൽ കൊളംബിയ യൂണിവേഴ്സിറ്റി ഒരു പങ്കാളിയായി.
മെയ് 2008: മൈക്രോസോഫ്റ്റ് അവരുടെ 750,000 പുസ്തകങ്ങളും 80 ദശലക്ഷം ജേണൽ ലേഖനങ്ങളും എത്തിയ സ്കാനിംഗ് പ്രോജക്റ്റ് അവസാനിപ്പിക്കാൻ പദ്ധതിയിട്ടു.
ഒക്ടോബർ 2008: രണ്ട് വർഷത്തെ ചർച്ചകൾക്ക് ശേഷം പ്രസിദ്ധീകരണ വ്യവസായികളും ഗൂഗിളും തമ്മിൽ ഒത്തുതീർപ്പിലെത്തി. ദശലക്ഷക്കണക്കിന് പുസ്തകങ്ങൾ പൊതുജനങ്ങൾക്ക് ലഭ്യമാക്കാനുള്ള അവകാശത്തിന് പകരമായി രചയിതാക്കൾക്കും പ്രസാധകരും നഷ്ടപരിഹാരം നൽകാൻ ഗൂഗിൾ സമ്മതിച്ചു.
ഒക്ടോബർ 2008: ഇൻസ്റ്റിറ്റ്യൂഷണൽ കോ-ഓപ്പറേഷൻ കമ്മിറ്റിയും കാലിഫോർണിയ സർവകലാശാലയിലെ 11 യൂണിവേഴ്സിറ്റി ലൈബ്രറികളും സംയുക്തമായി ഹാത്തിട്രസ്റ്റ് "ഷെയർഡ് ഡിജിറ്റൽ റിപ്പോസിറ്ററി" (പിന്നീട് ഹാത്തിട്രസ്റ്റ് ഡിജിറ്റൽ ലൈബ്രറി എന്നറിയപ്പെട്ടു) സമാരംഭിച്ചു, ഇവയെല്ലാം പ്രോജക്ടിൽ പങ്കാളികളായ ലൈബ്രറികളായിരുന്നു. ഗൂഗിളും മറ്റുള്ളവരും സ്കാൻ ചെയ്ത ശേഖരങ്ങളിൽ നിന്നുള്ള പുസ്തകങ്ങളിലേക്ക് ആർക്കൈവ് ചെയ്യാനും അക്കാദമിക് ആക്സസ് നൽകാനും ഇത് സഹായിക്കുന്നു.
നവംബർ 2008: ഗൂഗിളും അവരുടെ പ്രസിദ്ധീകരണ പങ്കാളികളും സ്കാൻ ചെയ്ത ഇനങ്ങളുടെ ബുക്ക് മാർക്ക് 7 മില്ല്യൺ കവിഞ്ഞു. ഇതിൽ 1 ദശലക്ഷത്തിൽ അധികം പൂർണ്ണ പ്രിവ്യൂ മോഡിലുളവയും 1 ദശലക്ഷത്തിൽ അധികം പൂർണ്ണമായി കാണാവുന്നതും ഡൗൺലോഡ് ചെയ്യാവുന്നതുമായ പൊതു സഞ്ചയത്തിൽ ഉള്ളവയും ആയിരുന്നു. ഏകദേശം അഞ്ചുലക്ഷത്തോളം അച്ചടി തീർന്ന പുസ്തകങ്ങളായിരുന്നു.
ഡിസംബർ 2008: ഗൂഗിൾ ബുക്സിൽ മാഗസിനുകൾ ഉൾപ്പെടുത്തുന്നതായി ഗൂഗിൾ പ്രഖ്യാപിച്ചു. ന്യൂയോർക്ക് മാഗസിൻ, എബോണി, പോപ്പുലർ മെക്കാനിക്സ് എന്നിവ ഇതിൽ ഉൾപ്പെടുന്നു.
ഫെബ്രുവരി 2009: ഐഫോൺ, ആൻഡ്രോയിഡ് ഫോൺ ഉപയോക്താക്കൾക്ക് യുഎസിലെ 1.5 ദശലക്ഷത്തിലധികം പബ്ലിക് ഡൊമെയ്ൻ വർക്കുകൾ (യുഎസിനു പുറത്ത് 500,000-ത്തിലധികം) ഒരു മൊബൈൽ ബ്രൗസർ ഉപയോഗിച്ച് വായിക്കാൻ അനുവദിക്കുന്ന ഗൂഗിൾ ബുക്ക് സെർച്ചിന്റെ ഒരു മൊബൈൽ പതിപ്പ് ഗൂഗിൾ പുറത്തിറക്കി. ഇതിൽ പേജ് ഇമേജുകൾക്ക് പകരം, പുസ്തകത്തിന്റെ പ്ലെയിൻ ടെക്സ്റ്റ് പ്രദർശിപ്പിക്കും.
മെയ് 2009: ന്യൂയോർക്കിലെ വാർഷിക ബുക്ക് എക്സ്പോ കൺവെൻഷനിൽ, പ്രസാധകർക്ക് അവരുടെ ഏറ്റവും പുതിയ പുസ്തകങ്ങളുടെ ഡിജിറ്റൽ പതിപ്പുകൾ ഗൂഗിൾ വഴി നേരിട്ട് ഉപഭോക്താക്കൾക്ക് വിൽക്കാൻ പ്രാപ്തമാക്കുന്ന ഒരു പ്രോഗ്രാം അവതരിപ്പിക്കാനുള്ള ഉദ്ദേശ്യം ഗൂഗിൾ സൂചിപ്പിച്ചു.
ഡിസംബർ 2009: പകർപ്പവകാശ നിയമങ്ങൾ ലംഘിച്ചു എന്ന് ആരോപിച്ച് ഫ്രാൻസിൽ പ്രസിദ്ധീകരിച്ച പകർപ്പവകാശമുള്ള പുസ്തകങ്ങളുടെ സ്കാനിംഗ് ഒരു ഫ്രഞ്ച് കോടതി തടഞ്ഞു. സ്കാനിംഗ് പ്രോജക്റ്റിന്റെ നിയപരമായുള്ള ആദ്യത്തെ വലിയ പരാജയമായിരുന്നു അത്.
മെയ് 2010: ആമസോൺ, ബാൺസ് & നോബിൾ, ആപ്പിൾ, മറ്റ് ഇലക്ട്രോണിക് ബുക്ക് റീട്ടെയിലർമാർ എന്നിവരുമായി മത്സരിക്കുണത്തിന് ഗൂഗിൾ എഡിഷൻസ് എന്ന പേരിൽ ഒരു ഡിജിറ്റൽ ബുക്ക് സ്റ്റോർ ഗൂഗിൾ ആരംഭിക്കുമെന്ന് റിപ്പോർട്ടുണ്ടായിരുന്നു. മറ്റുള്ളവയിൽ നിന്ന് വ്യത്യസ്തമായി, ഗൂഗിൾ പതിപ്പുകൾ പൂർണ്ണമായും ഓൺലൈനിലായിരിക്കും, കൂടാതെ ഒരു പ്രത്യേക ഉപകരണം (കിൻഡിൽ, നൂക്ക് അല്ലെങ്കിൽ ഐപാഡ് പോലുള്ളവ) ഇതിന് ആവശ്യമില്ല.
ജൂൺ 2010: ഗൂഗിൾ 12 ദശലക്ഷം പുസ്തകങ്ങൾ സ്കാൻ ചെയ്തു.
ഓഗസ്റ്റ് 2010: ഒരു ദശാബ്ദത്തിനുള്ളിൽ നിലവിലുള്ള 129,864,880 പുസ്തകങ്ങൾ സ്കാൻ ചെയ്യാൻ ഗൂഗിൾ ഉദ്ദേശിക്കുന്നതായി പ്രഖ്യാപിച്ചു, മൊത്തം 4 ബില്യണിലധികം ഡിജിറ്റൽ പേജുകളും 2 ട്രില്യൺ വാക്കുകളും ആണ് ഇതിലുണ്ടാകുക.
ഡിസംബർ 2010: ഗൂഗിൾ ഇബുക്കുകൾ യുഎസിൽ ആരംഭിച്ചു.
ഡിസംബർ 2010: ഗൂഗിൾ എൻഗ്രാം വ്യൂവർ അവതരിപ്പിച്ചു, അത് അതിന്റെ പുസ്തക ശേഖരത്തിലുടനീളമുള്ള പദ ഉപയോഗത്തെക്കുറിച്ചുള്ള ഡാറ്റ ശേഖരിക്കുകയും ഗ്രാഫ് ചെയ്യുകയും ചെയ്യുന്നു.
മാർച്ച് 2011: പ്രസിദ്ധീകരണ വ്യവസായികളും ഗൂഗിളും തമ്മിലുള്ള ഒത്തുതീർപ്പ് ഫെഡറൽ ജഡ്ജി നിരസിച്ചു.
മാർച്ച് 2012: ഗൂഗിൾ 20 ദശലക്ഷം പുസ്തകങ്ങൾ സ്കാൻ ചെയ്തു.
മാർച്ച് 2012: ഗൂഗിൾ പ്രസാധകരുമായി ഒത്തുതീർപ്പിലെത്തി.
നവംബർ 2013: ഓതേഴ്സ് ഗിൽഡ് വി. ഗൂഗിൾ കേസിൽ ന്യായമായ ഉപയോഗം ചൂണ്ടിക്കാട്ടി യുഎസ് ഡിസ്ട്രിക്റ്റ് ജഡ്ജ് ഡെന്നി ചിൻ ഗൂഗിളിനു അനുകൂലമായി വിധിച്ചു. അപ്പീൽ നൽകുമെന്ന് ഒതേഴ്സ് പറഞ്ഞു.
ഒക്ടോബർ 2015: ഗൂഗിൾ പകർപ്പവകാശ നിയമം ലംഘിച്ചിട്ടില്ലെന്ന് പ്രഖ്യാപിച്ച് അപ്പീൽ കോടതിയും ഗൂഗിളിനൊപ്പം നിന്നു. ന്യൂയോർക്ക് ടൈംസ് പറയുന്നതനുസരിച്ച്, ഗൂഗിൾ 25 ദശലക്ഷത്തിലധികം പുസ്തകങ്ങൾ സ്കാൻ ചെയ്തിട്ടുണ്ട്.
ഏപ്രിൽ 2016: ഓതേഴ്സ് ഗിൽഡിന്റെ അപ്പീൽ കേൾക്കാൻ യുഎസ് സുപ്രീം കോടതി വിസമ്മതിച്ചു, അതിനർത്ഥം കീഴ്ക്കോടതിയുടെ തീരുമാനം നിലനിൽക്കുകയും, നിയമം ലംഘിക്കാതെ ലൈബ്രറി പുസ്തകങ്ങൾ സ്കാൻ ചെയ്യാനും തിരയൽ ഫലങ്ങളിൽ സ്നിപ്പെറ്റുകൾ പ്രദർശിപ്പിക്കാനും ഗൂഗിളിന് തടസ്സങ്ങളില്ല എന്നാണ്.
സമാന പദ്ധതികൾ
പ്രോജക്ട് ഗുട്ടൻബർഗ്- സാംസ്കാരിക സൃഷ്ടികൾ ഡിജിറ്റൈസ് ചെയ്യുന്നതിനും ആർക്കൈവ് ചെയ്യുന്നതിനുമുള്ള ഒരു സന്നദ്ധപ്രവർത്തനമാണ് പ്രോജക്ട് ഗുട്ടൻബർഗ്. 1971-ൽ മൈക്കൽ എസ്. ഹാർട്ട് സ്ഥാപിച്ച ഇത് ഏറ്റവും പഴയ ഡിജിറ്റൽ ലൈബ്രറിയാണ്. 2015 ഒക്ടോബർ പ്രകാരം പ്രോജക്റ്റ് ഗുട്ടൻബർഗ്ന്റെ ശേഖരം 50,000 ഇനങ്ങളിൽ എത്തി.
ഇൻറർനെറ്റ് ആർക്കൈവ്- ലാഭേച്ഛയില്ലാതെ പ്രവർത്തിക്കുന്ന ഒരു സ്ഥാപനമാണ് ഇൻറർനെറ്റ് ആർക്കൈവ്, അത് പ്രതിദിനം 1000-ലധികം പുസ്തകങ്ങൾ ഡിജിറ്റൈസ് ചെയ്യുന്നു, കൂടാതെ ഗൂഗിൾ ബുക്സിൽ നിന്നും മറ്റ് ഉറവിടങ്ങളിൽ നിന്നുമുള്ള പുസ്തകങ്ങളെ പ്രതിഫലിപ്പിക്കുന്നു. 2011 മെയ് പ്രകാരം ഇത് 2.8 ദശലക്ഷത്തിലധികം പൊതു സഞ്ചയ പുസ്തകങ്ങൾ ഹോസ്റ്റുചെയ്തു, ഗൂഗിൾ ബുക്സിലെ ഏകദേശം 1 ദശലക്ഷം പൊതു സഞ്ചയ പുസ്തകങ്ങളേക്കാൾ വലുതാണ് ഇത്. ഇന്റർനെറ്റ് ആർക്കൈവിന്റെ സഹോദര പദ്ധതിയായ ഓപ്പൺ ലൈബ്രറി, 150 ലൈബ്രറികളിലെ സന്ദർശകർക്ക് സ്കാൻ ചെയ്ത് വാങ്ങിയ 80,000 വാണിജ്യ ഇ-ബുക്കുകൾ നൽകുന്നു.
2008 ഒക്ടോബർ 13 മുതൽ ഹായിത്തീ ട്രസ്റ്റ് ഡിജിറ്റൽ ലൈബ്രറി പരിപാലിക്കുന്നു, ഗൂഗിൾ സ്കാൻ ചെയ്ത മെറ്റീരിയലുകൾ, ചില ഇന്റർനെറ്റ് ആർക്കൈവ് പുസ്തകങ്ങൾ, പങ്കാളി സ്ഥാപനങ്ങൾ പ്രാദേശികമായി സ്കാൻ ചെയ്തവ എന്നിവ ഇത് സംരക്ഷിക്കുകയും ആക്സസ് നൽകുകയും ചെയ്യുന്നു. മയ് 2010 പ്രകാരം അതിൽ ഏകദേശം 6 ദശലക്ഷം വാല്യങ്ങൾ ഉൾപ്പെടുന്നു, അതിൽ 1 ദശലക്ഷത്തിലധികം പൊതു സഞ്ചയമാണ് (കുറഞ്ഞത് യുഎസിലെങ്കിലും).
എസിഎൽഎസ് ഹ്യുമാനിറ്റീസ് ഇ-ബുക്ക്, ഹ്യുമാനിറ്റീസിലും അനുബന്ധ സാമൂഹിക ശാസ്ത്രങ്ങളിലും ഉള്ള ഉയർന്ന നിലവാരമുള്ള 5,400-ലധികം പുസ്തകങ്ങളുടെ ഓൺലൈൻ ശേഖരം, സ്ഥാപനപരമായ സബ്സ്ക്രിപ്ഷൻ വഴി ആക്സസ് ചെയ്യാവുന്നതാണ്.
2006 അവസാനത്തോടെ ലൈവ് സെർച്ച് ബുക്സ് സൃഷ്ടിക്കാൻ 300,000 പുസ്തകങ്ങൾ സ്കാൻ ചെയ്യാൻ മൈക്രോസോഫ്റ്റ് ധനസഹായം നൽകി. 2008 മെയ് വരെ ഇത് തുടർന്നു, പദ്ധതി ഉപേക്ഷിക്കപ്പെടുകയും പുസ്തകങ്ങൾ ഇന്റർനെറ്റ് ആർക്കൈവിൽ സൗജന്യമായി ലഭ്യമാക്കുകയും ചെയ്തു.
നാഷണൽ ഡിജിറ്റൽ ലൈബ്രറി ഓഫ് ഇന്ത്യ (NDLI) ഇന്ത്യയുടെ മാനവ വിഭവശേഷി വികസന മന്ത്രാലയത്തിന് കീഴിലുള്ള ഒരു പദ്ധതിയാണ്. ഒരൊറ്റ വെബ് പോർട്ടലിൽ നിരവധി ദേശീയ അന്തർദേശീയ ഡിജിറ്റൽ ലൈബ്രറികൾ സംയോജിപ്പിക്കുക എന്നതാണ് ലക്ഷ്യം. എൻഡിഎൽഐ ഇംഗ്ലീഷിലും ഇന്ത്യൻ ഭാഷകളിലുമുള്ള നിരവധി പുസ്തകങ്ങളിലേക്ക് സൗജന്യ പ്രവേശനം നൽകുന്നു.
2010 പ്രകാരം ഏകദേശം 10 ദശലക്ഷം ഡിജിറ്റൽ ഒബ്ജക്റ്റുകളിലേക്ക് യൂറോപ്യന ലിങ്ക് ചെയ്യുന്നു, യൂറോപ്യൻ യൂണിയനിലെ 1,000-ലധികം ആർക്കൈവുകളിൽ നിന്നുള്ള കഴിഞ്ഞ 2,000 വർഷത്തെ യൂറോപ്യൻ ചരിത്രത്തിൽ നിന്നുള്ള വീഡിയോ, ഫോട്ടോകൾ, പെയിന്റിംഗുകൾ, ഓഡിയോ, മാപ്പുകൾ, കൈയെഴുത്തുപ്രതികൾ, അച്ചടിച്ച പുസ്തകങ്ങൾ, പത്രങ്ങൾ എന്നിവ ഇതിൽ ഉൾപ്പെടുന്നു.
ഫ്രഞ്ച് നാഷണൽ ലൈബ്രറിയിൽ നിന്നുള്ള ഗാലിക്ക, ഏകദേശം 4,000,000 ഡിജിറ്റൈസ് ചെയ്ത പുസ്തകങ്ങൾ, പത്രങ്ങൾ, കൈയെഴുത്തുപ്രതികൾ, ഭൂപടങ്ങൾ, ഡ്രോയിംഗുകൾ തുടങ്ങിയവയുമായി ലിങ്ക് ചെയ്യുന്നു. 1997-ൽ സൃഷ്ടിച്ച ഈ ഡിജിറ്റൽ ലൈബ്രറി പ്രതിമാസം 5000 പുതിയ ഡോക്യുമെന്റുകൾ എന്ന തോതിൽ വിപുലീകരിക്കുന്നത് തുടരുന്നു. 2008 അവസാനം മുതൽ, പുതിയ സ്കാൻ ചെയ്ത പ്രമാണങ്ങളിൽ ഭൂരിഭാഗവും ഇമേജ്, ടെക്സ്റ്റ് ഫോർമാറ്റുകളിൽ ലഭ്യമാണ്. ഈ രേഖകളിൽ ഭൂരിഭാഗവും ഫ്രഞ്ച് ഭാഷയിലാണ് എഴുതിയിരിക്കുന്നത്.
↑"Books of the world". August 5, 2010. Archived from the original on 2010-08-15. Retrieved 2010-08-15. After we exclude serials, we can finally count all the books in the world. There are 129,864,880 of them. At least until Sunday
↑Miller, Laura (8 December 2010). "Is Google leading an e-book revolution?". Salon. Archived from the original on 25 June 2017. Retrieved 11 January 2015. Google has incorporated reader reviews from the social networking service GoodReads, which helps, as these are often more thoughtful than the average Amazon reader review, but the "related books" suggestion lists still have some kinks to iron out — fans of Rebecca Skloot's "The Immortal Life of Henrietta Lacks" are referred to a trashy novel titled "Bling Addiction," for example
↑Rich, Motoko (January 4, 2009). "Google Hopes to Open a Trove of Little-Seen Books". New York Times. Archived from the original on 2009-04-10. Retrieved 2009-01-05. The settlement may give new life to copyrighted out-of-print books in a digital form and allow writers to make money from titles that had been out of commercial circulation for years. Of the seven million books Google has scanned so far, about five million are in this category.
↑"Google updates search index with old magazines". NBC News. Associated Press. December 10, 2008. Archived from the original on March 2, 2014. Retrieved June 29, 2009. As part of its quest to corral more content published on paper, Google Inc. has made digital copies of more than 1 million articles from magazines that hit the newsstands decades ago.
↑The number of Public Domain books at Google Books can be calculated by looking at the number of Public Domain books at HathiTrust, which is the academic mirror of Google Books. As of May 2010 HathiTrust had over 1 million Public Domain books.
↑Xio, Christina. "Google Books-An Other Popular Service By Google". Archived from the original on 4 April 2013. Retrieved 4 August 2012. Few years back the Microsoft abandoned the project and now all the books are freely available at the Internet archive.