Главная страница
Контакты

    Басты бет


Аңдатпа. Бұл мақалада Data mining интеллектуальды талдау құралы қарастырылған. Data mining интеллектуальды талдау құралындағы алгоритмдері мен оның жүзеге асырылуы келтірілген

жүктеу 100.66 Kb.



жүктеу 100.66 Kb.
бет1/2
Дата15.04.2017
өлшемі100.66 Kb.

Аңдатпа. Бұл мақалада Data mining интеллектуальды талдау құралы қарастырылған. Data mining интеллектуальды талдау құралындағы алгоритмдері мен оның жүзеге асырылуы келтірілген


  1   2

Сәлімханов Жәйліби Арыстанбекұлы

Магистрант 2 курс


Data mining интеллектуальды талдау құралы
Аңдатпа. Бұл мақалада Data mining интеллектуальды талдау құралы қарастырылған. Data mining интеллектуальды талдау құралындағы алгоритмдері мен оның жүзеге асырылуы келтірілген. Алгоритмдердегі жалпылама әдістері және жетістіктері мен Data mining интеллектуальды талдау құралында, маңыздылығы сипатталған. Бірінші, Data mining интеллектуальды талдау құралындағы алгоритмдік маңыздысы. Екінші, Data mining интеллектуальды талдау құралындағы маңыздысы және оның өмірдегі қолданысы.

Кілттік сөздер: Data mining, алгоритм,olap, телекомуникация,

R бағдармалау тілі, фармацевтика, молекулалық генетика, гендік инженерия, қауымдастық, реттілігі, жіктеу, кластер, болжау.

Әдіс , метод (гр. 'μέθοδος',methodes зерттеу не тану жолы, бір нәрсеге жетудің жолы) - көздеген мақсатқа жетудің тәсілі, тәртіпке келтірген қызмет жүйесі. Әдіс философияда зерттелетін нәрсенің ойша нұсқасын жасау үшін қажетті таным құралы болып табылады.

Алгоритм, алгорифм (ағылшынша: algorіthm, algorіsmus - Әл-Хорезмидің атынан шыққан) - бастапқы берілген мәліметтермен бір мәнде анықталатын нәтиже алу үшін қай амалды (жұмысты) қандай ретпен орындау қажеттігін белгілейтін есептерді (мәселелерді) шешу (математикалық есеп-қисаптар орындау, техникалық объектілерді жобалау, ғылыми-зерттеу жұмысын жүргізу т.б.)

Генетика - бүкіл тірі ағзаларға тән тұқым қуалаушылық пен өзгергіштікті зерттейтін биология ғылымының бір саласы. Ағзалардың тұқым қуалаушылығы мен өзгергіштігі туралы ғылымды генетика деп атайды (грекше “genetіkos” - шығу тегіне тән).

Гендік инженерия, немесе генетикалық инженерия - генетикалық және биохимиялық әдістердің көмегімен түраралық кедергілері жоқ, тұқым қуалайтын қасиеттері өзгеше, табиғатта кездеспейтін жаңа гендер алу; молек.


Кіріспе. Соңғы 5 онжылдықтардан бастап өзгерістер көп болып, әдетте технология болды. Ол тек қана алға жылжыту сияқты, жаңа өнертабыстар болып жатады. Бұл Data mining интеллектуальды талдау кұралына қатысты. Кез келген заманауи кәсіпорында, клиенттік база деректеріңде әдетте белгілі бір фактілерді немесе объектілердің есебін (мысалы, өнімдер мен клиенттерге сату туралы, т.с.с.) сақтау кестелер жиыны бар. Әдетте, бұл кестеде әрбір жазба нақты нысананы немесе фактіні сипаттайды. Мысалы, сату кестеде рекордты белгілі өнім, осындай клиентке сатылғанын фактіні көрсетеді, содан кейін осындай менеджер екенін, сондай-ақ ірі ақпарат қамтиды.

Ақпарат Ақпарат (лат. informatio - түсіндіру, мазмұндау) ұғымы күнделікті өмірден бастап техникалық салада пайдаланылатын көп мағыналы ұғым. Жалпы алғанда бұл ұғым шектеу, байланыс, бақылау, форма, инструкция, білiм, мағына, құрылым, бейнелеу, сезіну тағы басқа ұғымдармен тығыз байланысты.

Атап айтқанда, ақпараттық мәліметтер - бірнеше жылдар бойы жинақталған жазбалардың үлкен санының жиынтығы.

Мәліметтер (данные; data) - автоматты құралдардың көмегімен, кей жағдайда адамның қатысуымен, өңдеуге I ыңғайлы түрде берілген мағлұмат. Мәліметтердің кірістік, шығыстық, басқару, проблемалық, сандық, мәтіндік, графикалық және т.б.

Әлдеқайда құнды ақпарат көзі бола алады. Осындай кезде Data mining интеллектуальды қолдану және жүзеге асыру. Кез келген деректер арасындағы мәліметтерді шығару және оны тез есептеу үшін қажет болып табылады. Мұндай ақпарат әдетте болжау, стратегиялық жоспарлау, тәуекелдерді талдау және пайдалану, сондай-ақ компаниялар үшін ол өте пайдалы болып табылады.

Data Mining математикалық және статистикалық түрлі алгоритмдер арқылы улкен процесс белгілі технологиялар арқылы жасалынады.Олар : кластерлер, регресс және корреляциялық т.с.с. талдау болып табылады.

Осы зерттеудің мақсаты - айқын бизнес-процестерді көрсететін түрідегі ұсынуларды және бизнес жоспарлау (белгілі бір тауарларды немесе қызметтің сұраныс динамикасын немесе кез келген шараларда) тәуелділік үшін маңызды болып табылады.

Стратегия гр. strategia - әскер кіргізу - қоғамдық, саяси күреске басшылық өнері, оны жүргізудің қоғам (кәсіпорын, партия) дамуының нақты кезеңінің нақты жағдайларынан туындайтын жалпы жоспары, белгілі бір мақсатқа қол жеткізуге бағытталған қаражат пен ресурстарды пайдалану тәсілі.

Тәуелділік (Зависимость; dependence) функция мен оның аргументгері арасындағы қатынас; мәліметгер базасындағы мәліметтер ассоциациясы. Мәліметтер тәуелділігі (Зависимость данных (по данным); data dependence) - мәліметтер мен программаның өзара өсер етуі.

Математика Математика (гр. μάθημα - ғылым, білім, оқу; μαθηματικός - білуге құштарлық) - әлдебір әлемнің сандық қатынастары мен кеңістіктік формаларын, пішіндерін өлшейтін, оның ішінде - структуралар, өзгерістер, белгісіздік жөніндегі ғылым.

Тауар - қоғамда айырбастау, сатып алу-сату жолымен бөлінетін, құны бар еңбек өнімі, яғни материалдық-заттық пішіндегі өндірістік-экономикалық қызметтің кез келген өнімі, қажеттілікті қанағаттандыратын және базарға жұрттың назарын аудару, сатып алу, пайдалану не тұтыну мақсатымен ұсынылатын нәрселер, яғни сатып алу-сату, сатушы мен сатып алушы арасындағы нарықтық қатынастар нысаны.

Процестерді болжай алатын үлгісін салу т.с.с. сипаттамалары көрсетіледі. Бұл ұзақ уақыт деректерді талдау, сондай-ақ, біз бұрын айтып кеткен жедел аналитикалық өңдеу (жедел аналитикалық өңдеу, OLAP) негізгі құралдары деп есептеледі. Дәстүрлі математикалық статистиканы атап өткен жөн, әрқашан сәтті осындай мәселелерді шешу үшін пайдалану мүмкін емес. Әдетте, статистикалық әдістер және OLAP алдын ала тұжырымдалған болжамдарын тексеру үшін пайдаланылады. Алайда, жиі деректер емес, барлық үлгілері бірден түсінікті, өйткені гипотезаны тұжырымдау, болашақ шешім қабылдау үшін және бизнес-талдауын жүзеге асыру үшін негізгі мәселе болып табылады.

Гипотеза (гр. ὑπόθεσις - негізгі, жорамал) - белгілі бір құбылысты түсіндіру үшін алға тартылатын және тәжірибе түрінде тексеруді және сенімді ғылыми теория болып қалыптасу үшін теориялық негізді талап ететін ғылыми болжам, дәлелденбеген тұжырымдама, жорамал.

Қазіргі заманғы Data Mining технологияның негізі осы тән заңдылықтарын көрсететін, үлгілерінің тұжырымдамасына қойды. Осы үлгілеріннің шешу жолдары туралы кез келген, болжамдардын пайдалану ғана емес, одан әрі әртүрлі әдістермен көрсетіледі. Статистикалық талдау әдістерін қолдана отырып, жұмысты ұйымдастыру ғана емес, тез есептеу және дұрыс шешімін табу. Data Mining деректердің маңызды ерекшелігі, үлгілерінің стандартты ғана емес және коммерциялық емес болып табылады. Басқаша айтқанда, Data Mining құралдары статистикалық деректердің OLAP құралдар айырмашылығы бар және оның орнына алдын ала пайдаланушылар тексеру олар қолда бар деректер негізінде өзара бағаланады деп, жалғыз осындай өзара табу және олардың сипаты туралы болжам алады дегенді білдіреді.

Деректерді өңдеу арқылы нәтижелерін шығару. Әдетте іздеу жолдарын, жалпы түсіне білу. Data mining деректерін пайдалану мен қатар статистикалық құралдар және OLAP-құралдарын пайдалануын жоққа шығармауды атап өткен жөн.



Теоритикалық негіз.Қазіргі кезде тез жылдам жұмыс жасайтын технологиялар дамып келеді.Тез жасаудың бір себебі алгоритмнің пайдалы болғаны. Ондағы уақыттың үнемдеуі, алгоритмнің структурасы маңызды болуы. Осыған байланысты Data mining алгоритмін қолдану. Ондағы Data mining алгоритімдерін салыстырып, тез есептеу және тиімділігін табу.Осыған орай бірнеше алгоритмдер қарастырылады. Негізгі ерекшеліктердің бірі болып табылады. Data mining пайдалана отырып, тереңірек қарастыру, математикалық есептеулер, ықтималдыққа қажетті комбинациясын жасауға пайдалы. Мұның барлық мысалдарын кем дегенде шамамен түсінікті болуы үшін, көптеген жағдайларда жеткілікті қарапайым R бағдармалау тілін қолдану.

Жағдай - адам әрекетінің , жан-жануарлар тіршілігінің, табиғат пен қоғамдағы өзгерістің, оқиғаның, т.б. айналадағы ортаның ықпалына тәуелділігін білдіретін философиялық ұғым. Табиғаттағы, қоғамдағы белгілі бір өзгерісті тудырушы алғышарт есебінде де қарастырылады.

Бұдан басқа бағдарламау тілдерінде қолдануға болады. Негізі R бағдарламау тілі Data mining көп салалы аудандарында қолданылады. Мысалдарға келтіретін болсақ, алгоритм операциялық иллюстрациялар. Атап айтқанда, алгоритмдер немесе одан да көп күрделі алгоритмдер үшін ірі қадамдарға арналған.

Ішкі алгоритмі мәліметтерін түсіндіруге және есептеулерге көмектесуіне зор. Олардың көбісі толық алгоритмдерін, қазіргі R бағдарламау тіл арқылы іске асыру немесе псевдокодпен жазылады. Тағы да бір ерекшілік, математикалық формуласы арқылы алгоритмдер сипатталады.

Формула (Formula) - электрондық кестедегі (Excel) математикалық өрнек, оның жұмыс нәтижесі торлардағы мәндерге байланысты болады. Мысалы, D5 торына енгізілген мынадай формула =а5+b5+с5 A5, В5, С5 торындағы сандардың қосындысын D5 торына орналастырады.

Математикалықтың бірнеше шешу жолдарын нақтылау, ерекшеліктерін сипаттау, дұрыс әдістерін қарастыру. Осы мысал код - тардың кейбір бөліктерін пайдалану тиімді болу мүмкін, бірақ шын мәнінде, іс жүзінде пайдалы болғаны. Жалпы, математикалық функцияларды қолдану үшін ең алдымен R бағдарламау тілдің пакеттеріне аса мән беру қажет. Толық болған жағдайда, жеткілікті және тиімді болғаны. Әрі қарай күрделі математикалық функциялар үшін маңызды.

Келесі зерттеу жағдайы бұл үлкен мысалдар үшін R бағдарламау тілін пайдалана отырып, демонстрация алгоритмдер жиынымен сипатталған. Олардың мақсаты - ерекші жауапкершілік болып табылатыны, алгоритмдердің қалай жұмыс жасап жатқаны, атап айтқанда тек түсіндіру ғана емес, функциялардың құрылымы және рет ретімен жасалатын процесс.

Жауапкершілік - адам бойындағы белгілі бір істі , өзіне тапсырылған міндетті орындап, жүзеге асыруынан байқалатын адамгершілік қасиет; тұлғаның қоғамда немесе ұжымда қабылданған әлеуметтік, өнегелі және кұқықтық нормалар мен ережелеріне, борыш сезіміне сәйкес өз қызметін бақылау қабілеттілігі.

Құрылым (лат. structura - түзіліс, орналасу, тәртіп) - объектінің тұтастығын, тепе-теңдігі мен негізгі қасиеттерінің сақталуын қамтамасыз ететін байланыстар мен қатынастар жиынтығы. Құрылым жүйе және элемент ұғымдарымен тығыз байланысты.

R бағдарламау тілдің көмегімен жасалады.

Кез келген кәсіпорын (коммерциялық, өнеркәсіптік, медициналық, ғылыми және т.б.

Медицина Медицина (лат. medicina: medicus - дәрігерлік, емдік) - адамдардың денсаулығын сақтау мен нығайту, сырқаттарды емдеу мен аурудың алдын алу, денсаулық және жұмысқа қабілеттілік жағдайында, адамзат қоғамында ұзақ өмір сүруге жетуді көздейтін тәжірибелік іс-әрекеттің және ғылыми білімдердің жүйесі.

) қызметі енді барлық ақпараттарың және оның қызметкерлердің барлық мәліметтерін деректер базасына жазып отыр. Кейбір кәсіпорындар data mining облыстық технологиясын қолданып, жұмыстың тез жүруі, кәсіпорынның пайда әкелуіне септігін тигізеді.

Data Mining бағдарламалары :

3.1.Сауда

Мұнда сауда секторында data mining көмегімен шешуге болады, кейбір әдеттегі проблемалар болып табылады:

Сауда жүйесін талдау, болжау моделдерін ұсыну. Осы сауда саласына карта және қолма қол ақшалай төлеу жолдарын шешу. Оған компьютерлік жүйесін іске асыру.

Қызметкер, жұмыскер - жұмысты еңбек шарты (келісімшарт) негізінде орындаушы, кәсіпорынның, ұйымның, мекеменің ішкі еңбек тәртібіне бағынушы адам. Еңбек заңнамасына сәйкес азаматтық-құқықтық шарттардың кез келгені бойынша (мердігерлік шарт, тапсырма, авторлық шарт бойынша) жұмыс атқарушы адам қызметкер болып саналмайды.

Компьютер (ағылш. computer - «есептегіш»), ЭЕМ (электрондық есептеуіш машина) - есептеулерді жүргізуге, және ақпаратты алдын ала белгіленген алгоритм бойынша қабылдау, қайта өңдеу, сақтау және нәтиже шығару үшін арналған машина.

3.2.Банк ісі

Келесі тапсырмалар үшін банк өнеркәсібінде пайдаланылатын Data Mining технологиялық жетістіктер:

Кредиттік карталарымен алаяқтықты анықтау. Өткен операцияларды, талдай отырып, банк заңдылықтары осындай алаяқтықты анықтайды. Болжау : Data Mining банктер өз клиенттерінің құның болжауға , модельдерін құруға және әрбір санатты қызметтерге көмектеседі.

3.3.Телекомуникация

Телекоммуникациялық саласында Data Mining әдістері компаниялардың маркетингтік бағдарламалар мен қолданыстағы клиенттерді ұстап қалу және жаңаларын тартуға көмектеседі.

Маркетинг (ағылш. marketіng - рынок‚ базар‚ өткізу‚ сауда) - кәсіпорынның (фирманың, бірлестіктің‚ т.б.) тауар өндіру-өткізу және сауда жасау қызметін ұйымдастыру мен басқару жүйесі. Маркетинг нарық дамуының жай-күйі мен келешегін зерделеуге негізделеді, тұтыну мен өндіріс өніміне (тауарға‚ көрсетілетін қызметке) сұранымды қалыптастырады, табыс алу мақсатымен рынокта тауарлардың өткізілуін тездетуге бағытталады. Маркетинг - сұранымды жан-жақты зерделеп‚ болжау‚ жарнаманы пайдалану‚ өндірісті ынталандыру‚ сақтау мен тасымалдаудың осы заманғы тәсілдерін‚ тауарлардың тұтынушыға жетуіне жәрдемдесетін тех. және басқа түрлерін қолдану негізінде кәсіпорынның жаңа өнімді әзірлеу‚ өндіру мен өткізу жөніндегі ұйымдық-техникалық‚ қаржы‚ коммерциялық және басқа қызмет түрлері жатады.

Типтік бағыттары мыналар болып табылады:

  1   2

  • Кілттік сөздер
  • Теоритикалық негіз.

  • жүктеу 100.66 Kb.