ディープラーニングのためのテキスト分析
Data Quality for Deep Learning

About


ディープラーニングは、ビジネスのあらゆる側面を劇的に変えるAIアプリケーションの核となるものです。 とは言え、 ディープラーニングはデータがなくては機能できず、エンタープライズデータは秩序、一貫性、判読性に欠けていることが多々あります。 正確な深層学習モデルの作成は高品質なトレーニングデータにかかっています。当社の分析プラットフォームは、複数言語による自動分析を通じてデータの完全性を高めます。

Deep learning is the core of AI applications revolutionizing all aspects of business, but producing accurate deep learning models depends on quality training data. Our text analytics automates bringing integrity to “messy” enterprise data in many languages. It roots out mixed languages (e.g., Chinese mixed inside Japanese data), can resolve character corruption issues, and fuzzy matches names within or across languages and scripts. We use a hybrid of machine learning, rules, and the best technologies for each capability including language identification, character normalization, tokenization, lemmatization, entity extraction and resolution.