രൂപീകരണം, കോളേജുകളും സർവ്വകലാശാലകളും
കോർപ്പസ് ഭാഷാശാസ്ത്രം എന്താണ്?
ഏതാനും പതിറ്റാണ്ടുകളായി മുമ്പ് ഭാഷാ ഗവേഷണ ഓട്ടോമേറ്റ്, ശാസ്ത്രജ്ഞർ മാത്രം സ്വപ്നം കഴിഞ്ഞില്ല. ജോലി കൈ ചെയ്തു, അത് വിദ്യാർത്ഥികളുടെ ഒരു വലിയ എണ്ണം ആകർഷിക്കുന്ന, അവിടെ ഒരു ഗണ്യമായ സാധ്യത "അശ്രദ്ധമായ" തെറ്റുകൾ ആണ്, ഏറ്റവും പ്രധാനമായി - ഈ ഒരു നീണ്ട, കാലം എടുത്തു.
കമ്പ്യൂട്ടർ സാങ്കേതിക വികസനം വേഗത്തിൽ റിക്ടർ ഉത്തരവു ഗവേഷണം നടത്താൻ സാധ്യമാക്കിയത്, ഇന്ന് ഭാഷ പഠിക്കാൻ ഏറ്റവും ഉൾനാടൻ ദിശകൾ ഒരു ഒരു കോർപ്പസ് ഭാഷാശാസ്ത്രം ആണ്. ഇതിന്റെ പ്രധാന സവിശേഷത ഒരു പ്രത്യേക വഴിയിൽ, ഒരു ഡാറ്റാബേസ് വാചകത്തിന്റെ വിവരങ്ങൾ, വിവരങ്ങൾ വലിയ അളവിൽ ഉപയോഗം ആണ് അടയാളപ്പെടുത്തിയിരിക്കുന്ന ശരീരം വിളിച്ചു.
ഇന്നുവരെ, ദശലക്ഷത്തിലധികം പതിനായിരക്കണക്കിന് .ഫീസിന്റെ യൂണിറ്റ് ബില്യൺ വരെ ഭരണപ്രദേശത്തെയും വിവിധ ഭാഷാ മെറ്റീരിയൽ അടിസ്ഥാനത്തിൽ വിവിധ ആവശ്യങ്ങൾക്കായി ഉപയോഗിച്ച് സൃഷ്ടിച്ച പല കെട്ടിടങ്ങൾ ഉണ്ട്. ഈ ദിശയിൽ ഒരു വാഗ്ദാനമാണ് തിരിച്ചറിഞ്ഞിട്ടില്ല അപ്ലിക്കേഷൻ ഗവേഷണ ആവശ്യങ്ങൾക്കായി നേരെ കാര്യമായ പുരോഗതി പ്രകടമാക്കുന്നു ആണ്. വിദഗ്ധർ, ഒരു വഴി അല്ലെങ്കിൽ സ്വാഭാവിക ഭാഷയിലും മറ്റൊരു ഇടപാട്, അത് കുറഞ്ഞത് ഒരു അടിസ്ഥാന തലത്തിൽ പാഠങ്ങളുടെ ശരീരം മനസ്സിലാക്കാൻ ഉത്തമം.
കോർപ്പസ് ഭാഷാശാസ്ത്രം ചരിത്രം
ഈ പ്രവണത രൂപീകരണം കഴിഞ്ഞ നൂറ്റാണ്ടിന്റെ തുടക്കത്തിൽ 60-ഇഎസ് ൽ ബ്രൗൺ ശരീരത്തിൽ യുണൈറ്റഡ് സ്റ്റേറ്റ്സ് സൃഷ്ടിക്ക് കാരണം. ശേഖരം 1 വചനം ഫോമുകൾ ദശലക്ഷം പാഠങ്ങളുടെ ഉൾപ്പെടുന്നു, ഇന്നും ഈ വലുപ്പത്തിലുള്ള ശരീരം തികച്ചും ഉന്ചൊംപെതിതിവെ തന്നെ. ഈ കമ്പ്യൂട്ടർ സാങ്കേതിക വികസന പേസ്, അതുപോലെ പുതിയ ഗവേഷണ വിഭവങ്ങൾ വേണ്ടി ആവശ്യം ആധാരമാക്കിയായിരുന്നു ആണ്.
90 കോർപസ് ഭാഷാശാസ്ത്രം മുഴുവൻ സ്വതന്ത്ര അച്ചടക്കം കയറി ഉയർന്നുവന്നു, വാചകങ്ങൾ ഒരു ശേഖരം വലിച്ചെടുത്തു ഭാഷകളുടെ ഡസൻ വേണ്ടി അടയാളപ്പെടുത്തിയിരിക്കുന്നു. ഈ കാലയളവിൽ ഇത് സൃഷ്ടിക്കപ്പെട്ടിരിക്കുന്നു ഉദാഹരണത്തിന്, ബ്രിട്ടീഷ് ദേശീയ കോർപ്പസ് 100 ദശലക്ഷം ടോക്കണുകൾ.
ഭാഷാശാസ്ത്രം ഈ പ്രദേശങ്ങളുടെ വികസനം കൂടി, ടെക്സ്റ്റ് വാല്യങ്ങൾ കൂടുതൽ കൂടുതൽ ഭീമേശ്വരി (നിഘണ്ടു യൂണിറ്റുകൾ കോടിക്കണക്കിന് എത്താൻ), ഒപ്പം ലേഔട്ട് കൂടുതൽ വികേന്ദ്രീകരിക്കപ്പെട്ടുകൊണ്ടിരിക്കുന്നു ആണ്. തീയതി, ഇന്റർനെറ്റിൽ സ്പേസ് ശവം എഴുതിയ കണ്ടെത്തി ഭാഷ, ബഹുഭാഷാ, പഠന-oriented കലാമൂല്യമുള്ള അക്കാദമിക് സാഹിത്യം, അതുപോലെ മറ്റു പല സ്പീഷീസ് പറഞ്ഞ കഴിയും.
ഭവന എന്തൊക്കെ
ശരീരം ഭാഷാശാസ്ത്രം ൽ ബോഡി തരം പല കാരണങ്ങളാലും നൽകിയേക്കാം. ഇംതുഇതിവെല്യ് ക്ലാസിഫിക്കേഷൻ അടിസ്ഥാനം ഒരു ടെക്സ്റ്റ് ഭാഷ (റഷ്യൻ, ജർമൻ), ആക്സസ് മോഡ് കഴിയും (ഓപ്പൺ സോഴ്സ്, അടച്ചു, വാണിജ്യ), സ്രോതസ്സ് (ഫിക്ഷൻ, ഡോക്യുമെന്ററി, അക്കാദമിക്, പത്രപ്രവർത്തനം) ഇഷ്ടവും.
രസകരമായ വഴി പറഞ്ഞ ഭാഷ വസ്തുക്കൾ ഉണ്ടാക്കുന്നു. സർവേയിൽ ഒരു കൃത്രിമ അന്തരീക്ഷം സൃഷ്ടിക്കാൻ അത്തരം പ്രസംഗം ബോധപൂർവമായ റെക്കോർഡിംഗ്, തത്ഫലമായി വസ്തുക്കൾ "പൊടുന്നനെ" വിളിക്കപ്പെടും കഴിഞ്ഞില്ല, ആധുനിക കോർപ്പസ് ഭാഷാശാസ്ത്രം മറ്റ് പോയിരുന്നു. ഒരു സന്നദ്ധ ഒരു മൈക്രോഫോൺ സജ്ജീകരിച്ചിരിക്കുന്നു, പകലും അത് പങ്കാളിയായ എല്ലാ സംഭാഷണങ്ങളും ഒരു റെക്കോർഡ് നിർമ്മിക്കുകയും. ചുറ്റും ആളുകൾ, തീർച്ചയായും, ദൈനംദിന സംഭാഷണം വഴിത്താരകളിൽ ശാസ്ത്രത്തിന്റെ വികസന സംഭാവന അറിയില്ല.
പിന്നീട് റെക്കോർഡ് ഡാറ്റാബേസ് സംഭരിക്കുകയും അച്ചടിച്ച ട്രാൻസ്ക്രിപ്റ്റോ തരം ഒപ്പമുണ്ടായിരുന്നു ചെയ്യുന്നു ലഭിച്ചു. അങ്ങനെ, അത് ഒരു വാക്കാലുള്ള പ്രതിദിന പ്രസംഗം ഭവന സൃഷ്ടിക്കാൻ ആവശ്യമായ സാധ്യമായ മാർക്കപ്പ് മാറുന്നു.
അപേക്ഷ
എവിടെയായിരുന്നാലും സാധ്യമായ ഭാഷ, കെട്ടിടങ്ങൾ പാഠങ്ങളുടെ ഒരുപക്ഷേ ഉപയോഗിക്കുന്നതിനും. ഭാഷാശാസ്ത്രത്തിൽ പള്ള അപേക്ഷിക്കാൻ രീതികൾ വരാം:
- കീ നിർണ്ണയിക്കുന്നതിൽ ഒരു പ്രോഗ്രാം സൃഷ്ടിക്കുന്നു, വ്യാപകമായി യഥാക്രമം, വോട്ടർമാരും ഉപയോക്താക്കളിൽ പോസിറ്റീവ്, നെഗറ്റീവ് പ്രതികരണങ്ങൾ ട്രാക്ക് സൂക്ഷിക്കാൻ രാഷ്ട്രീയ ബിസിനസ് ഉപയോഗിക്കുന്നു.
- അവരുടെ പ്രകടനം മെച്ചപ്പെടുത്താൻ നിഘണ്ടു പരിഭാഷകരുടെ കണക്ഷൻ വിവരങ്ങൾ സിസ്റ്റം.
- ഭാഷ യൂണിറ്റ്, വികസന ചരിത്രവും സമീപഭാവിയിൽ മാറ്റങ്ങൾ പ്രവചനം ബുദ്ധി കാരണമാകുന്ന ഗവേഷണ ജോലികൾ വൈവിധ്യമാർന്ന.
- , മൊര്ഫൊലൊഗിചല് വായനാനുഭവം, വേറൊരു മറ്റ് സവിശേഷതകൾ അടിസ്ഥാനമാക്കി വിവരം വീണ്ടെടുക്കലും വികാസവും.
- വിവിധ ഭാഷാ സംവിധാനങ്ങൾ മറ്റുള്ളവരുടെ ഒപ്റ്റിമൈസേഷൻ.
കെട്ടിടങ്ങളുടെ ഉപയോഗം
ഒരു സാധാരണ സെർച്ച് എഞ്ചിൻ ഉപയോഗിച്ച് സമാനമായ വിഭവ ഇന്റർഫേസ്, വിവര അടിസ്ഥാന തിരയുന്നതിനായി പദങ്ങൾക്ക് ഒരു വാക്ക് അല്ലെങ്കിൽ കോമ്പിനേഷൻ നൽകാൻ ഉപയോക്താവിൽ. ഞങ്ങളുടെ കൃത്യമായ അന്വേഷണം ഫലത്തിൽ യാതൊരു ഭാഷാപരമായ മാനദണ്ഡം .ചിത്രത്തിന്റെ കണ്ടെത്താൻ സഹായിക്കുന്ന മെച്ചപ്പെടുത്തിയ പതിപ്പ്, ഉപയോഗിക്കാം രൂപം.
തിരയൽ അധിഷ്ഠിത വരാം:
- പ്രസംഗം ഭാഗങ്ങൾ ഒരു പ്രത്യേക ഗ്രൂപ്പ് അംഗത്വം;
- വ്യാകരണ സവിശേഷതകൾ;
- സെമാന്റിക്കുകൾക്കും;
- ശൈലീപരമായും വൈകാരികവുമായ നിറവും.
നിങ്ങൾക്ക് വാക്കുകൾ ഒരു സീക്വൻസിന് തിരയൽ മാനദണ്ഡം, ഉദാഹരണത്തിന്, ക്രിയയുടെ "ൽ" ഒപ്പം ദിതീയവിഭക്തി കേസിൽ നാമം ശേഷം വരുന്ന വർത്തമാന കാലം, ആദ്യ പദത്തിന്റെ, ക്രിയക്ക് എല്ലാ സന്ദർഭങ്ങളും കണ്ടെത്താൻ നമുക്ക് കഴിയും. അത്തരം ഒരു ലളിതമായ ടാസ്ക് പരിഹാരം ഉപയോക്താവ് ഒരു കാട് വ്യക്തമാക്കിയ മേഖലകളിലെ ഏതാനും മൗസ് ക്ലിക്കുകൾ ആവശ്യമാണ്.
സൃഷ്ടിക്കുന്ന പ്രക്രിയ
തിരയൽ തന്നെ ഒരു പ്രത്യേക ലക്ഷ്യം ആശ്രയിച്ച്, എല്ലാ സുബ്ചൊര്പുസ് പ്രത്യേക തിരഞ്ഞെടുക്കപ്പെട്ട ന് പുറത്തു കൊണ്ടുപോയി കഴിയും:
- ആദ്യ ഘട്ട കേസ് അടിസ്ഥാനം രൂപം കാലാനുസൃതമായി നിർവ്വചിക്കാനുള്ള ആണ്. പ്രായോഗിക ആവശ്യങ്ങൾക്കായി, ഇടക്കിടെ പത്രപ്രവർത്തനത്തിന്റെ, വാർത്തകൾ, ഓൺലൈൻ അഭിപ്രായങ്ങൾ ഉപയോഗിക്കുന്നു. ഗവേഷണ പദ്ധതി പാക്കേജ് തരം വൈവിധ്യമാർന്ന ഉപയോഗം, എന്നാൽ, ചില ചേര്ക്കുന്നു അനുസരിച്ച് തിരഞ്ഞെടുക്കും വേണം.
- പ്രെത്രെഅത്മെംത് വിധേയമാക്കിയിരുന്നു പാഠങ്ങളുടെ ഫലമായി ശേഖരം, പിശകുകൾ തിരുത്തൽ, എന്തെങ്കിലും ഉണ്ടെങ്കിൽ, പാഠത്തിന്റെ ബിബ്ലിയോഗ്രഫിക് അധിക-ഭാഷാ വിവരണം തയ്യാറാക്കിയ ഇല്ല.
- പുറത്തായി എല്ലാ വാക്യരഹിതമാണോ വിവരങ്ങൾ: ഗ്രാഫിക്സ്, ചിത്രങ്ങൾ, പട്ടികകൾ മായ്ക്കുന്നു.
- സാധാരണ മറ്റൊരു പ്രക്രിയയ്ക്കായി പ്രസംഗം, ആയ ടോക്കണുകൾ, ഒരു വിഹിതം ആണ്.
- അവസാനമായി, മൂലകങ്ങളുടെ ചതുരശ്രയടി ലഭിച്ച, മൊര്ഫൊലൊഗിചല് സ്യ്ംതച്തിചല് മറ്റ് ഉടലിൽ കൊണ്ടുപോയി.
പ്രസംഗം ഭാഗമായി തിരിച്ചറിയുന്നത് ഓരോന്നും ഘടകങ്ങൾ ഒരു ചതുരശ്രയടി അതിൽ വിതരണം, ഒരു വായനാനുഭവം ഘടന നടത്തിയ എല്ലാ ഇടപാടുകളും ഫലം, വ്യാകരണ, ഒപ്പം ചില കേസുകളിൽ, വേറൊരു ഗുണങ്ങളെ.
കെട്ടിടങ്ങൾ സൃഷ്ടിക്കുന്നതിൽ ബുദ്ധിമുട്ടുകൾ
അത് ആ ശരീരം വാക്കുകളോ വാചകങ്ങൾ ഒരു കൂട്ടം ഒരുമിച്ച് പോരാ മനസ്സിലാക്കാൻ പ്രധാനമാണ്. ഒരു വശത്ത്, കൃതികൾ ശേഖരിച്ചുവെയ്ക്കാൻ മിതപ്പെടുത്തേണ്ടതുണ്ട്, ആണ്, ചില മുറപ്രകാരം പാഠങ്ങളുടെ വ്യത്യസ്ത തരം പ്രതിനിധാനം. മറ്റ് ന് - ആല ഉള്ളടക്കം ഒരു പ്രത്യേക വിധത്തിൽ സ്പെയ്സ് വേണം.
ആദ്യ പ്രശ്നം ഒരു കരാർ പ്രകാരം തീർന്നു: ഉദാഹരണത്തിന്, ശേഖരത്തിൽ സാഹിത്യ പാഠങ്ങളുടെ 60%, ഡോക്യുമെന്ററികൾ 20% ഉൾപ്പെടുന്നു, ഒരു നിശ്ചിത ശതമാനം ഇന്ന് നിലവിലില്ല ഭാഷ, നിയമനിർമാണം, ശാസ്ത്രീയ പ്രവൃത്തികൾ, മുതലായവ തികഞ്ഞ പാചകക്കുറിപ്പ് സമതുലിതാവസ്ഥ ശരീരം ഒരു എഴുതിയ പ്രാതിനിധ്യം കൊടുത്തിരിക്കുന്നു ...
രണ്ടാം ചോദ്യം, ഉള്ളടക്കം ലേഔട്ട് കുറിച്ചു വെല്ലുവിളി പരിഹരിക്കാൻ. പാഠങ്ങളുടെ അടയാളപ്പെടുത്തിയതിന് ഓട്ടോമാറ്റിക് ഉപയോഗിക്കുന്നു പ്രത്യേക പരിപാടികൾക്കും ആൽഗരിതങ്ങൾ ഉണ്ട്, എന്നാൽ അവർ ഒരു തികഞ്ഞ ഫലം നൽകരുത് തടസ്സങ്ങൾ ഉണ്ടാകുന്നതിനും മാനുവൽ തോഷിബ ആവശ്യമായി വരാം. ഈ പ്രശ്നം കൈകാര്യം അവസരങ്ങളും വെല്ലുവിളികളും ഒരു പേപ്പർ കോർപ്പസ് ഭാഷാശാസ്ത്രം എന്ന വി പി ജഹരൊവ വിശദമായി പ്രതിപാദിച്ചിരിക്കുന്നു.
ടെക്സ്റ്റ് മാർക്ക്അപ്പ് ഞങ്ങൾ താഴെ ലിസ്റ്റ് പല തലങ്ങളിൽ, ചെയ്തത് നടപ്പിലാക്കുന്നത്.
മൊര്ഫൊലൊഗിചല് ടാഗുചെയ്യൽ
സ്കൂൾ മുതൽ, ഞങ്ങൾ റഷ്യൻ ഭാഷയിൽ, പ്രസംഗം വിവിധ ഭാഗങ്ങളിൽ ഉണ്ട് എന്നും അവരിൽ ഓരോ സ്വന്തം പ്രത്യേകതകൾ ഉണ്ട് ഓർക്കുക. ഉദാഹരണത്തിന്, ക്രിയ ചെരിവ് ഏത് ആരും ക്രിയ സമയം വിഭാഗങ്ങൾ ഉണ്ട്. മടിയും കൂടാതെ തനതായ നാമങ്ങൾ ആൻഡ് .സമ്മിശ്രസംഖ്യാഗണ ക്രിയകൾ താഴ്ന്നു, എന്നാൽ 100 ദശലക്ഷം ശരീരം അടയാളപ്പെടുത്താൻ. ഒടുക്കക്കള്ളിയിലെത്തുന്നതു മാനുവൽ തൊഴിൽ പ്രവർത്തിക്കില്ല. എല്ലാ ആവശ്യമായ പ്രവർത്തനങ്ങൾ കമ്പ്യൂട്ടർ നടപ്പിലാക്കാൻ കഴിയൂ, എന്നാൽ, ഇതിനു വേണ്ടി പഠിപ്പിച്ചു ചെയ്യേണ്ടത് ആവശ്യമാണ്.
മൊര്ഫൊലൊഗിചല് ടാഗിംഗ്, കമ്പ്യൂട്ടർ ചില വ്യാകരണ സവിശേഷതകൾ ഇല്ലാത്ത സംഭാഷണത്തിന്റെ ഒരു ഭാഗമായി ഓരോ വചനം "മനസ്സിലാക്കാൻ" വേണം. മുതൽ റഷ്യൻ (മറ്റ് ഭാഷകൾ) സാധാരണ നിയമങ്ങൾ ഒരു എണ്ണം പ്രവർത്തിക്കുന്നുണ്ട്, അത് അൽഗോരിതങ്ങൾ ഒരു എണ്ണം കാർ നിക്ഷേപം, മൊര്ഫൊലൊഗിചല് വിശകലനത്തിനായി ഒരു ഓട്ടോമാറ്റിക് നടപടിക്രമം തയ്യാറാക്കുന്നതിന് സാധ്യമാണ്. എന്നാൽ, ചട്ടം ഒഴിവാക്കലുകൾ, അതുപോലെ വിവിധ ചൊംപ്ലിചതിന്ഗ് ഘടകങ്ങൾ ഉണ്ട്. തത്ഫലമായി, ഇന്ന് അറ്റ കമ്പ്യൂട്ടർ വിശകലനം ഇതുവരെ അനുയോജ്യമായ നിന്ന്, പോലും 4% പിശക് മാനുവൽ തോഷിബ ആവശ്യമായി, 4 മില്യൻ ഒരു മൂല്യം ലഭിക്കും. 100 ദശലക്ഷം ശരീരത്തിൽ വാക്കുകൾ. യൂണിറ്റുകൾ.
വിശദമായ പുസ്തകം പ്രശ്നം ജഹരൊവ വി പി "കോർപ്പസ് ഭാഷാശാസ്ത്രം" വിവരിക്കുന്നു.
വായനാനുഭവം വ്യാഖ്യാനം
പാഴ്സിംഗ് അല്ലെങ്കിൽ പാഴ്സിംഗ് - ഒരു വാക്യത്തിൽ വാക്കുകളുടെ ബന്ധം നിർണ്ണയിക്കുന്ന ഒരു നടപടിക്രമം. ആൽഗോരിഥുകളുടെ ഉപയോഗിക്കുന്നത് വിഷയം, ആഖ്യാതമായിട്ടോ, കൂട്ടിച്ചേർക്കലുകൾ, ഒന്നിലധികം പ്രസംഗം വളവുകൾ വാചകം നിർണ്ണയിക്കാൻ സാധ്യമാണ്. കണ്ടെത്തുക മുഖ്യ ശ്രേണിയിലുള്ള വചനങ്ങൾ, ഏത് - ആശ്രിത, ഞങ്ങൾ ഫലപ്രദമായി ടെക്സ്റ്റ് നിന്നും വിവരങ്ങൾ വേർതിരിച്ചെടുക്കാൻ കഴിയും ഒരു തിരയൽ അഭ്യർത്ഥന ഞങ്ങൾക്ക് രസകരമായ വിവരങ്ങൾ പ്രതികരണമായി നൽകാൻ മെഷീൻ പഠിപ്പിക്കാൻ.
വഴിയിൽ, ആധുനിക സെർച്ച് എഞ്ചിനുകൾ ഇത്തരം "എത്ര കലോറി ആപ്പിൾ" അല്ലെങ്കിൽ പ്രസക്തമായ അന്വേഷണത്തിന് ഉത്തരമായി പ്രത്യേക നമ്പറുകൾ പകരം നീണ്ട പുസ്തകങ്ങളിൽ നൽകരുതെന്ന് ഇത് ഉപയോഗിക്കാം "സെന്റ് പീറ്റേഴ്സ്ബർഗ് മാസ്കോ ൽ ദൂരം." എന്നാൽ, മറ്റ് അടിസ്ഥാന ട്യൂട്ടോറിയൽ "കോർപ്പസ് ഭാഷാശാസ്ത്രം ആമുഖം" വിദഗ്ദ്ധനെ ആവശ്യം വിശേഷിപ്പിച്ചത് പ്രക്രിയ പോലും അടിസ്ഥാനവിവരങ്ങൾ മനസ്സിലാക്കാൻ.
വേറൊരു മാർക്കപ്പ്
വചനം സെമാന്റിക്കുകൾക്കും -, അർത്ഥം ലളിതമായി ആണ്. ഒരു വാക്ക് കടപ്പാട് ടാഗുകൾ വേറൊരു വിശകലനം വരെ വ്യാപകമായി ഉപയോഗിക്കാൻ സമീപനം, തന്റെ വേറൊരു വിഭാഗങ്ങളും ഉപവർഗ്ഗങ്ങൾ ഒരു കൂട്ടം പെടുന്ന പ്രതിഫലിപ്പിക്കുന്നു. അത്തരം വിവരങ്ങൾ പരമാവധി അൽഗോരിതങ്ങൾ ടെക്സ്റ്റ് ടോൺ, ഓട്ടോമാറ്റിക് സുംമരിജതിഒന് ആൻഡ് കോർപ്പസ് ഭാഷാശാസ്ത്രം മറ്റു ചുമതലകൾ രീതികൾ വിശകലനം വിലപ്പെട്ട ആണ്.
മരത്തിന്റെ "റൂട്ട്" ഒരു എണ്ണം വളരെ വിപുലമായ സെമാന്റിക്കുകൾക്കും ഒരു അമൂർത്ത വചനം പ്രതിനിധീകരിക്കുന്ന ഉണ്ട്. വൃക്ഷം നോഡുകൾ ഒരു ശാഖ കൂടുതൽ കൂടുതൽ നിർദ്ദിഷ്ട .ഫീസിന്റെ ഘടകങ്ങൾ അടങ്ങുന്ന, രൂപപ്പെടുന്നത്. ഉദാഹരണത്തിന്, വചനം "ജീവി" "മനുഷ്യ" ഉം "മൃഗം" പോലുള്ള ആശയങ്ങൾ സാദ്ധ്യതയുണ്ട്. മൃഗങ്ങളുടെ ക്ലാസുകൾ തരങ്ങളും ന് - ആദ്യ വചനം വ്യത്യസ്ത തൊഴിലുകളിൽ, കുടുംബബന്ധങ്ങൾ നിബന്ധനകൾ, ദേശീയത, രണ്ടാമത്തെ കയറി മുളെച്ചുവന്നു തുടരും.
വിവരം വീണ്ടെടുക്കലും സംവിധാനങ്ങളുടെ ഉപയോഗം
കോർപ്പസ് ഭാഷാശാസ്ത്രം ഉപയോഗം മേഖലകൾ പ്രവർത്തനം വിവിധ നിലങ്ങളും മൂടി. ഹൊഉസിന്ഗ്സ് നിഘണ്ടുക്കൾ തയ്യാറാക്കുവാൻ ശാസനയ്ക്കും, വിവരണം, വസ്തുതകൾ വീണ്ടെടുക്കുന്നതിൽ, ടോൺ മറ്റ് ടെക്സ്റ്റ് പ്രോസസ്സിംഗ് നിർണ്ണയിക്കുന്നതിൽ ഉപയോഗിച്ച ഓട്ടോമേറ്റഡ് പരിഭാഷാ സംവിധാനങ്ങൾ സൃഷ്ടിക്കുക, ചെയ്യുന്നു.
പുറമേ, അത്തരം വിഭവങ്ങൾ സജീവമായി ലോക ഭാഷകളിൽ പൊതുവായി ഭാഷ പ്രവർത്തനങ്ങൾക്ക് സംവിധാനങ്ങളെ പഠനം ഉപയോഗിക്കുന്നു. പ്രീ-തയ്യാറാക്കിയ വിവരങ്ങൾ വലിയ തോതിൽ ആക്സസ്സ് വികസന ഭാഷകളിൽ പ്രവണതകളും ദ്രുതഗതിയിലുള്ള സമഗ്രവുമായ പഠനം സൗകര്യമൊരുക്കുന്നു, സ്ഥിരമായ രൂപീകരണം നെഒലൊഗിസ്മ്സ് പ്രസംഗം സ്പീഡ് മാറ്റം .ഫീസിന്റെ യൂണിറ്റുകൾ മറ്റുള്ളവരും വിലമതിക്കുന്നു.
ഡാറ്റ ഇത്തരം വലിയ അളവിൽ പ്രവൃത്തി ഓട്ടോമേഷൻ ആവശ്യമാണ് മുതൽ, ഇന്ന് അവിടെ കമ്പ്യൂട്ടറും കോർപ്പസ് ഭാഷാശാസ്ത്രം തമ്മിലുള്ള അടുത്ത ഇടപെടൽ ആണ്.
റഷ്യൻ ദേശീയ കോർപ്പസ്
ഈ കേസിൽ (ന്ക്ര്യ ചുരുക്കിപ്പറയുന്നു) ജോലികൾ വൈവിധ്യമാർന്ന ഒരു റിസോഴ്സ് ഉപയോഗം അനുവദിക്കുന്നു സുബ്ചൊര്പുസ് ഉൾപ്പെടുന്നു.
ഡാറ്റാബേസിൽ വസ്തുക്കൾ തിരിച്ചിട്ടുണ്ട് ന്ക്ര്യ:
- ആഭ്യന്തര വിദേശ രണ്ട് മീഡിയ 90 2000 ത്തിലും പ്രസിദ്ധീകരണങ്ങൾ, വരെ;
- റെക്കോർഡിംഗ് പ്രസംഗം;
- അക്ത്സെംതൊലൊഗിഛെസ്കി പാഠങ്ങളൊന്നും (അതായത്, സമ്മർദ്ദം മാർക്ക്) അടയാളപ്പെടുത്തിയിരിക്കുന്നു;
- വകഭേദമാണ് പ്രസംഗം;
- കവിത;
- വായനാനുഭവം മറ്റ് ഉടലിൽ മെറ്റീരിയല്.
വിവരങ്ങൾ സംവിധാനം ഇംഗ്ലീഷിലേക്ക്, ജർമ്മൻ റഷ്യൻ നിന്നും പ്രവൃത്തികളുടെ സമാന്തര വിവർത്തനങ്ങൾ, ഫ്രഞ്ച് മറ്റു പല ഭാഷകളും (തിരിച്ചും) കൂടെ സുബ്ചൊര്പുസ് ഉൾപ്പെടുന്നു.
കൂടാതെ ഡാറ്റാബേസ് അവിടെ അതിന്റെ വളർച്ചയുടെ വിവിധ കാലഘട്ടങ്ങളിൽ റഷ്യൻ ഭാഷയിൽ എഴുതിയ പ്രസംഗം പ്രതിനിധീകരിക്കുന്ന, ചരിത്രഗ്രന്ഥങ്ങളിൽ ഒരു വിഭാഗം ആണ്. റഷ്യൻ ഭാഷ ഹൃദിസ്ഥമാക്കി വിദേശ പൗരന്മാർക്ക് ഉപയോഗപ്പെടും ഒരു പരിശീലന ശരീരം അവിടെയുണ്ട്.
റഷ്യൻ ദേശീയ കോർപ്പസ് അടങ്ങുന്നതാണ് 400 ദശലക്ഷം .ഫീസിന്റെ യൂണിറ്റുകൾ, പല തരത്തിൽ മുന്നിൽ യൂറോപ്പ് മൃതദേഹങ്ങൾ ഭാഷകളിൽ ഗണ്യമായ ഭാഗം.
പ്രതീക്ഷകളാണ്
ഈ പ്രവണത അംഗീകാരം അനുകൂലമായി വസ്തുത അതുപോലെ വിദേശ, റഷ്യൻ സർവകലാശാലകളിൽ ലബോറട്ടറി കോർപ്പസ് ഭാഷാശാസ്ത്രം വാഗ്ദാനം ലഭ്യത ആണ്. ഈ വിവരം, തിരയൽ വിഭവങ്ങൾ ചട്ടക്കൂട് ഉപയോഗം ഗവേഷണ കൂടി, ഉയർന്ന സാങ്കേതിക മേഖലയിലെ ചില പ്രദേശങ്ങളുടെ വികസനം സത്യമായും ചോദ്യത്തിന്-ഉത്തരം സിസ്റ്റങ്ങൾ, എന്നാൽ മുകളിൽ ചർച്ച ചെയ്യുന്നു.
കോർപ്പസ് ഭാഷാശാസ്ത്രം കൂടുതൽ വികസന കമ്പ്യൂട്ടറുകൾ ശാക്തീകരിക്കുക, എല്ലാ തലങ്ങളിലും പ്രവചിക്കപ്പെടും,, സാങ്കേതിക വിവരങ്ങൾ തിരയുന്നത് പ്രോസസിംഗ് എന്നിവ ഒപ്റ്റിമൈസ് പുതിയ ആൽഗോരിഥമുകളുടെ നടപ്പാക്കാൻ കാര്യത്തിൽ മുതൽ കൂടുതൽ റാം, ഉപഭോക്തൃ നിമിത്തം ഉപയോക്താക്കൾക്ക് അവരുടെ ദൈനംദിന ഉറവിട ഈ തരത്തിലുള്ള ഉപയോഗിക്കാൻ കൂടുതൽ കൂടുതൽ വഴികളും ജീവിതം.
ഉപസംഹാരമായി
കഴിഞ്ഞ നൂറ്റാണ്ടിന്റെ മധ്യത്തിൽ 2017 ൽ സ്പചെശിപ്സ് ആളുകൾ എല്ലാ കവിതകളും പ്രപഞ്ചത്തിന്റെ റോബോട്ടുകൾ വഴി യാത്ര എവിടെ വിദൂരഭാവിയിൽ, തോന്നി. വാസ്തവത്തിൽ, ശാസ്ത്രം "വെളുത്ത പാടുകൾ" വര്ദ്ധിപ്പിക്കുന്നതിനായി ആൻഡ് അസ്വസ്ഥജനകമായ നൂറ്റാണ്ടുകളായി മനുഷ്യരിൽ ചോദ്യങ്ങൾക്ക് ഉത്തരം ആശയറ്റ ശ്രമങ്ങളെല്ലാം ആണ്. ഇവിടെ ഭാഷ പ്രവർത്തിക്കുന്ന ചോദ്യങ്ങൾ ബഹുമാനസൂചകമായി സ്ഥലം അളന്ന്, കാബിനറ്റ്, കമ്പ്യൂട്ടേഷണൽ ഭാഷാശാസ്ത്രം ഉത്തരം നമ്മെ സഹായിക്കും.
നല്കുമെന്നും, മുമ്പ് വലിയ ഡാറ്റ സെറ്റ് സംസ്കരണം പാറ്റേണുകൾ, തിരിച്ചറിയാനാകും ഏകദേശം തത്സമയം വാക്കുകൾ രൂപീകരണം ട്രാക്ക് നിർദ്ദിഷ്ട ഭാഷ സവിശേഷതകൾ വികസനം പ്രവചിക്കാൻ.
ഒരു പ്രായോഗിക തലത്തിൽ, ആഗോള അനുബന്ധങ്ങളും, ഉദാഹരണത്തിന്, പൊതു മൂഡ് വിലയിരുത്താൻ സാധ്യതയുള്ള ഉപകരണമായി കാണാൻ കഴിയും - ഇന്റർനെറ്റ് യഥാർത്ഥ ഉപയോക്താക്കൾ സൃഷ്ടിച്ച സ്ഥിരമായി നിത്യേന വിവിധ ഗ്രന്ഥങ്ങളിൽ ആണ് ഈ അഭിപ്രായങ്ങളും അവലോകനങ്ങളും ലേഖനങ്ങളും, സ്പീച്ച് മറ്റു പല രൂപങ്ങൾ.
കൂടാതെ, ശരീരങ്ങൾ ജോലി വിവരം വീണ്ടെടുക്കലും മുഴുകുന്ന അതേ ഹാർഡ്വെയർ, വികസനം സമ്മാനിക്കുന്നു സര്വീസ് പരിചയമുണ്ട് "Google" അല്ലെങ്കിൽ "പരാഗ്വേ", മെഷീൻ, ഇലക്ട്രോണിക് നിഘണ്ടുക്കൾ.
നാം ആത്മവിശ്വാസത്തോടെ കോർപ്പസ് ഭാഷാശാസ്ത്രം മാത്രമേ ആദ്യ നടപടികൾ ചെയ്യുന്നു വാദിക്കുന്നു കഴിയും, സമീപ ഭാവിയിൽ തഴെക്കും.
Similar articles
Trending Now