Abstract:
Internet технологияларының дамуына байланысты желіде адам өміріне қауіп тудыратын және мемлекетпен рұқсат етілмеген ақпараттар көптеп таралып жатыр. Cайттардың саны халықтың жартысынан да көп және тез тарауда. Сондықтан ақпараттың үлкен көлемін өңдеу қажеттілігі туындауда және ол күрделі жұмыс. Бұл мәселені ішінара шешуге қазіргі уақытта белсенді түрде құрылған мәтіндер корпусы қызмет етеді. Бұл жұмыста тыйым салынған контентті анықтау үшін қажетті мәтіндік корпусты құру қарастырылады.