INNOSCIENCE

Innovation , Science and Technology

INNOSCIENCE

Innovation , Science and Technology

۳ مطلب با موضوع «علم داده» ثبت شده است

۱- ایجاد یک تابع توسعه محصول علم اطلاعات
برای اینکه سازمان ها و شرکت های بزرگ به موفقیت دست یابند، سه سطح
 کلی برای استراتژی آنها وجود دارد: رقابت،تمایز و دستیابی به موفقیت. اگر شما در کسب و کار پیش بینی هستید و بهترین محصول رقابتی موجود در بازار از دقت حدود ۷۰٪ برخوردار است، یک استراتژی دستیابی به موفقیت برای آن محصول دارای دقتی نزدیک به ۹۰٪ یا٪۹۵ میباشد.

۲-  تعادل بین تحقیقات کیفی و کمی
در قدم بعدی، شما باید بدانید که چه نوع تحقیقاتی را دانشمند داده ی شما انجام خواهد داد. در زمینه تحقیق، دو روش اساسی وجود دارد: کمی و کیفی.
تحقیق کیفی در مورد اکتشاف و اصطلاحات علم داده است. در تحقیقات کیفی، دانشمندان داده به دنبال موضوع هایی در دریای عظیمی از داده ها هستند. این داده ها می توانند ساختاریافته، بدون ساختار، یا در دسترس نباشد. اگر آنها موفق شوند، آنها مفاهیم و الگوهایی در داده های شما کشف می کنند که شما هرگز نمی دانستید.  روش پژوهش دیگر کمی است. در تحقیقات کمی،  دانشمندان داده، فرضیات را تست کرده و توسعه می دهند. تحقیقات کمی آنچه از تحقیقات کیفی بدست می آید را تایید می کنند.

۳- وجود یک برنامه پشتیبان گیری در موارد عدم دستیابی به موفقیت

منبع > تک ریپابلیک و مفتا

  • حمید میرالوند

با رشد تکنولوژی های Big Data نقش جدیدی در شرکت های بزرگ به نام دانشمند داده (Data Scientist) ایجاد شده است که در حقیقت نسخه ی جدیدی از نقش تحلیلگر داده یا تحلیلگر تجارت/بازار می باشد. چیزی که این نقش را با نقش های ذکر شده متفاوت می سازد، دانش و تیزهوشی تجاری برای گرفتن تصمیمات سخت و سریع و انتقال آنها به هر دو بخش روسای شرکت و رهبران IT است تا بتوانند بهترین راه را برای غلبه بر یک چالش تجاری بیابند. در حقیقت دانشمند داده با دسترسی به حجم زیادی داده، حس کنجکاوی و زیر سوال بردن پیش فرض های فکری سعی می کند تا مواردی را بیابد که برای سازمان مزیت رقابتی ایجاد کند. به طور خلاصه می توان گفت یک دانشمند داده شخصی است دارای اطلاعات کافی از هر دو رشته ی مهندسی کامپیوتر و آمار. البته در مورد مهارت های مورد نیاز برای یک مهندس داده در ادامه توضیح خواهم داد.

نقش دانشمند داده در سازمان به صورت «بخشی تحلیلگر، بخشی هنرمند» توصیف می شود تا جایی که Anjul Bhambhri، معاون بخش محصولات Big Data در شرکت IBM می گوید: «یک دانشمند داده شخصی کنجکاو است که می تواند به داده ها خیره شده و روندهای متشابه را کشف کند. او در حقیقت مانند یک انسان دوره ی رنسانس است که شدیدا می خواهد یاد بگیرد و تغییر ایجاد کند.»

مهارت های مورد نیاز برای یک دانشمند داده عبارتند از:

  • آمار، ریاضیات
  • ابزارهای متن باز: Haddop، Apache Spark و …
  • الگوریتم، زبان های برنامه نویسی
  • یادگیری ماشین و visualization
  • شناخت حوزه ی داده ی مورد بررسی

لازم به ذکر است، به دلیل پیچیدگی های هر یک از موارد ذکر شده و اینکه بیشتر این موارد دارای دکترای تخصصی خود می باشند، این امکان وجود ندارد که یک نفر در تمامی این موارد متخصص گردد و شما می‌بایست پس از آشنایی اولیه با هر کدام از این موارد تخصص مورد علاقه ی خود را پیدا کنید و آن را ادامه دهید و داشتن دید اولیه در سایر موارد کفایت می کند.

منبع» Radiance

  • حمید میرالوند

ریشه های داده کاوی در میان سه خانواده از علوم، قابل پیگیری می باشد .مهمترین این خانواده ها، آمار کلاسیک می باشد. بدون آمار، هیچ داده کاوی وجود نخواهد داشت، بطوری‌که آمار، اساس اغلب تکنولوژی هایی می باشد که داده کاوی بر روی آنها بنا می شود. آمار کلاسیک مفاهیمی مانند تحلیل رگرسیون، توزیع استاندارد، انحراف استاندارد، واریانس، تحلیل خوشه، و فاصله های اطمینان را که همه این موارد برای مطالعه داده و ارتباط بین داده ها می باشد، را در بر می گیرد. مطمئناً‌ ‌‌تحلیل آماری کلاسیک نقش اساسی در تکنیک‌های داده کاوی ایفا می کند.

دومین خانواده ای که داده کاوی به آن تعلق دارد هوش مصنوعی می باشد. هوش مصنوعی که بر پایه روش‌های ابتکاری می باشد و با آمار ضدیت دارد، تلاش دارد تا فرایندی مانند فکر انسان، را برای حل مسائل آماری بکار بندد. چون این رویکرد نیاز به توان محاسباتی بالایی دارد، تا اوایل دهه ۱۹۸۰ عملی نشد. هوش مصنوعی کاربردهای کمی را در حوزه های علمی و حکومتی پیدا کرد، اما نیاز به استفاده از کامپیوترهای بزرگ با عث شد همه افراد نتوانند از تکنیک‌های ارائه شده استفاده کنند.

سومین خانواده داده کاوی، یادگیری ماشین. می باشد، که به مفهوم دقیق‌تر، اجتماع آمار و هوش مصنوعی می باشد. درحالی‌که هوش مصنوعی نتوانست موفقیت تجاری کسب کند، یادگیری ماشین در بسیاری از موارد جایگزین آن گردید. از یادگیری ماشین به عنوان تحول هوش مصنوعی یاد شد، چون مخلوطی از روش‌های ابتکاری هوش مصنوعی به همراه تحلیل آماری پیشرفته می باشد. یادگیری ماشین اجازه می دهد تا برنامه های کامپیوتری در مورد داده ای که آن‌ها مطالعه می کنند، مانند برنامه هایی که تصمیم‌های متفاوتی بر مبنای کیفیت داده مطالعه شده می گیرند، یادگیری داشته باشند و برای مفاهیم پایه ای آن از آمار استفاده می کنند و از الگوریتم‌ها و روش‌های ابتکاری هوش مصنوعی را برای رسیدن به هدف بهره می گیرند.

داده کاوی در بسیاری از جهات، سازگاری تکنیک‌های یادگیری ماشین با کاربردهای تجاری است. بهترین توصیف از داده کاوی بوسیله اجتماع آمار، هوش مصنوعی و یادگیری ماشین بدست می آید. این تکنیک‌ها سپس با کمک یکدیگر، برای مطالعه داده و پیدا کردن الگوهای نهفته در آنها استفاده می شوند. بعضی از کاربردهای داده کاوی به شرح زیر است:

  • کاربردهای معمول تجاری: از قبیل تحلیل و مدیریت بازار، تحلیل سبد بازار، بازاریابی هدف، فهم رفتار مشتری، تحلیل و مدیریت ریسک؛
  • مدیریت و کشف فریب: کشف فریب تلفنی، کشف فریب‌های بیمه ای و اتومبیل، کشف حقه های کارت اعتباری، کشف تراکنشهای مشکوک مالی (پولشویی)؛
  • متن کاوی: پالایش متن (نامه های الکترونیکی، گروههای خبری و غیره)؛
  • پزشکی: کشف ارتباط علامت و بیماری، تحلیل آرایه های DNA ، تصاویر پزشکی؛
  • ورزش: آمارهای ورزشی؛
  • وب کاوی: پیشنهاد صفحات مرتبط، بهبود ماشین‌های جستجوگر یا شخصی سازی حرکت در وب سایت؛
منبع» مفتا
  • حمید میرالوند