Big Data[6] -பிக் டேட்டா என்றால் அதிகமான தகவல்களா?

டேட்டா, டேட்டா பேஸ், டேட்டா பேஸ் மேனேஜ்மெண்ட் சாஃப்ட்வேர்

பிக் டேட்டாவுக்குள் செல்லும் முன் டேட்டா (Data), டேட்டா பேஸ் (Data Base), டேட்டா பேஸ் மேனேஜ்மெண்ட் சாஃப்ட்வேர் (Data Base Managemnet Software) குறித்தும் அறிந்துகொள்ள வேண்டியது அவசியம்.

டேட்டா என்பதை தகவல்(கள்) எனலாம். உதாரணத்துக்கு ரம்யா என்ற மாணவியின் பெயர் தகவலின் ஒரு பகுதி. ரம்யா என்ற மாணவியின் பெயருடன், அவருக்கான கல்லூரி அடையாள எண், அவருடைய வயது, பாலினம், முகவரி, படிக்கும் கல்லூரி, படித்துவரும் பாடப்பிரிவு இதுபோன்ற தகவல்கள் சேர்ந்ததே முழுமையான டேட்டா.

டேட்டா பேஸ் என்பதை தகவல்களை சேகரித்து வைத்துக்கொள்ளும் தளம் எனலாம். அதாவது, பலதரப்பட்ட தகவல்களை எளிதாக கையாளும் வகையிலும், சுலபமாக பராமரித்து அப்டேட் செய்யும்படியாகவும், முறையாக சேகரித்து வைத்துக்கொள்ளும் விதத்திலும் செயல்படும் தகவல்தளம் எனலாம்.

உதாரணத்துக்கு, ரம்யா என்ற மாணவியின் தகவல்களை முறையாக சேகரித்ததைப் போல அந்தக் கல்லூரியில் படிக்கும் அத்தனை மாணவ மாணவிகளின் தகவல்களையும் முழுமையாக முறையாக சேகரித்து வைத்திருந்தால் மட்டுமே முழுமையான தகவல்தளமாக செயல்படும். மாணவ மாணவிகளின் கல்லூரி அடையாள எண்ணை வைத்து தகவல்களை தேடுவது சுலபமாக இருக்கும். மாற்றங்கள் செய்து அப்டேட் செய்வதும் தவறில்லாமல் நடைபெறும்.

     ஆக, முறையாக சேகரிக்கப்பட்ட தகவல்களை உள்ளடக்கியதே தகவல்தளம்.

முறையாக சேகரிக்கப்பட்ட தகவல்களை உள்ளடக்கிய தகவல்தளத்தை கையாள்வதற்கு உதவுகின்ற தொழில்நுட்பத்துக்கு தகவல்தள பராமரிப்பு (Data Base Management System) என்று பெயர். அதற்கு பயன்படுத்தப்படும் சாஃப்ட்வேர்கள் தகவல்தள பராமரிப்பு சாஃப்ட்வேர்கள் (Data Base Management System Software) என்று அழைக்கப்படுகின்றன.

டிபேஸ் (dBASE), ஃபாக்ஸ்பேஸ் (FoxBase), ஃபாக்ஸ்ப்ரோ (FoxPro), கிளிப்பர் (Clipper) என அடிப்படை சாஃப்ட்வேரில் இருந்து தொடங்கி எம்.எஸ்.அக்ஸஸ் (MSACCESS), ஆரக்கிள் (ORACLE), எஸ்.கியூ.எல் (SQL), மை எஸ்.கியூ.எல் (MYSQL), டிபி2 (DB2) என பல்வேறு காலகட்டங்களில் பலதரப்பட்ட டேட்டா பேஸ் சாஃப்ட்வேர்கள் பயன்படுத்தப்பட்டு வந்தன.

இப்போதும் ஆரக்கிள், எஸ்.கியூ.எல், மை எஸ்.கியூ.எல் போன்ற சாஃப்ட்வேர்கள் பயன்பாட்டில் உள்ளன. இன்னும் ஒருசில இடங்களில் எம்.எஸ்.அக்ஸஸ்கூட பயன்படுத்தப்பட்டு வருகிறது.

இவை தகவல்களை குறிப்பிட்ட பயன்பாடுகளுக்கு மட்டுமே பயன்படுத்த உதவி செய்கின்றன.

தற்சமயம் ஹடூப் (Hadoop), நோ எஸ்.கியூ.எல் (NoSQL), எம்.பி.பி (Massively Parallel Processing-MPP), மங்கோடிபி (MongoDB) போன்றவை பரவலாக பரபரப்பான பயன்பாட்டில் உள்ளன.   பிக்டேட்டாவில் பயன்படுத்தப்படும் தொழில்நுட்பங்களும் இவற்றில் உள்ளன.

இவை தகவல்களை பல்வேறு கோணங்களில் அதிவேகத்தில் துல்லியமாக அலசி ஆராய்ந்து ஒரு குறிப்பிட்ட பயன்பாட்டுக்கு மட்டும் அல்லாமல் பல்வேறு பயன்பாடுகளுக்கும் உபயோகப்படுத்தும் வகையில் செயல்படுகின்றன.

நம்பகத்தன்மையுடன் கூடிய அதிகமான தகவல்கள், அதிகமான வேகம், பலதரப்பட்ட பல்வேறு பிரிவுகளில் தகவல்கள் – இவைதான் பிக் டேடாவின் சிறப்பு.

பிக் டேட்டா என்றால் என்ன?

பிக் டேட்டா என்ற தலைப்பை வைத்து, நிறைய தகவல்கள் கொட்டிக்கிடந்தால் மட்டுமே அதை நாம் பிக் டேட்டா என்று சொல்லிவிட முடியாது.

இந்தியாவில் வசிக்கும் மக்கள் அத்தனை பேரையும் டேட்டா பேஸில் பதிவு செய்துவிட்டால் அது பிக் டேட்டா அல்ல. தினமும் பல்லாயிரக்கணக்கில் மக்கள் வந்துசெல்லும் மிகப்பெரிய மாலில் உள்ள ஸ்கேனர் எண்ணிக் கொடுக்கும் அன்றைய தினம் மாலுக்குள் சென்று திரும்பியவர்கள் எண்ணிக்கை பிக் டேட்டாவாகிவிடாது. ரயில் நிலையம், ஏர்போர்ட் போன்ற இடங்களில் தினந்தோறும் குவியும் மக்கள் தொகை கணக்கெடுப்புப் பதிவும் பிக் டேட்டாவில் வராது.

     கருப்புக் கோட் போட்ட அத்தனை பேரும் வக்கீலும் அல்ல, வெள்ளை கோட் போட்டவர் அனைவரும் டாக்டரும் அல்ல என்பதைப்போல நிறைய தகவல்கள் சேகரித்து வைக்கும் டேட்டா பேஸ் எல்லாமே பிக் டேட்டாவாகிவிடாது. அதற்கென முக்கியமான சிறப்பம்சங்களும், செயல்பாடுகளும் உள்ளன.

அன்புடன்

காம்கேர் கே. புவனேஸ்வரி, CEO
Compcare Software private Limited

மார்ச் 25, 2019

(குங்குமம் – வார இதழில் 2017-ம் ஆண்டு நான் எழுதிய கட்டுரைத் தொடரில் இருந்து…)

(Visited 76 times, 1 visits today)
error: Content is protected !!
Compcare K. Bhuvaneswari