본문 바로가기

Computer Science74

[캐글] 첫번째 노트북 발행 - Fish Market 캐글에 있는 Fish Market이라는 데이터셋으로 생애 첫번째 노트북을 썼다. 이 데이터셋과 연관된 Task는 두개였는데, 물고기의 무게 예측이랑 물고기 종 예측 중 난 무게 예측을 해봤다. 비록 간단한 회귀문제였지만, 처음으로 스스로 score을 낸 문제라서 기쁨 😙 이번주에 배운 데이터캠프 내용으로 다음주도 새로운 데이터셋을 풀어봐야겠다. - EDA 매우 중요한 것 같은데, 통계적 베이스가 너무 부족하다는 것을 느꼈다. - 어떻게 하면 score을 더 올릴 수 있을지 고민했다. (현재 95%) - Outlier data를 어떻게 처리할 수 있을까? = 혼자만 다른 경향을 갖고있는 물고기 종류. 2021. 9. 5.
DataCamp ML Scientist 참고 자료 DataCamp의 ML Scientist 과정을 들으면서, Andrew Ng Deeplearning.ai 코스를 함께 듣고 있다. ML Scientist에서 다루는 내용이 되게 많은데, 원리에 대한 설명이 부족한 경우가 있어서 구글링이나 유튜브로 개념을 더해줘야 한다. 참고해서 공부한 링크들을 나중에 찾아보기 편하도록 정리해두었다. https://docs.google.com/document/d/1Y6pr4eNQRj8EuCLW94j58edu7HQeRLuQRwou2TtQDDs/edit?usp=sharing DataCamp_ML Scientist Syllabus WEEK1 Supervised Learning with sklearn About sklearn train_test_split module https:.. 2021. 9. 2.
[WEEK1] Supervised Learning with scikit-learn 스터디 첫 주가 끝났다. 지도학습의 전반적인 내용과 sklearn 사용법에 대해 배웠다. 1. Classification: classification problems using supervised learning techniques. - Supervised Learing = using already labeled data - Numerical / Visual EDA = pandas, seaborn - k-Nearest Neighbors Algorithm = setting a decision boundary - Measuring model performance - Train/test split = split data for training the model, testing - Overfitting and .. 2021. 8. 31.
[링크] The Beginner’s Guide to Kaggle elitedatascience.com/beginner-kaggle The Beginner's Guide to Kaggle In this guide, we'll cover everything beginners need to know about getting started on Kaggle. Plus, we'll share our 7 favorite tips for enjoying Kaggle. elitedatascience.com 2021. 1. 31.
[링크] My Machine Learning Journey and First Kaggle Competition towardsdatascience.com/my-machine-learning-journey-and-first-kaggle-competition-fcb57523d614 My Machine Learning Journey and First Kaggle Competition How i started Data Science and First Experience. towardsdatascience.com 2021. 1. 30.
[링크] AI, Deep Learning and Big Data are Eating the Biotech World medium.com/frenchtech/ai-deep-learning-and-big-data-are-eating-the-biotech-world-6c3a09bc85b4 AI, Deep Learning and Big Data are Eating the Biotech World The biotech world is not the same as it was just five years ago. Technologies like artificial intelligence, deep learning and big data have… medium.com The life sciences industry is especially challenging in that it involves a much longer lead .. 2021. 1. 30.
[Python] csv 파일에서 특정 단어를 가진 열 찾아보기 import csv def csv_word(filename, word): f = open(filename, 'r') content = csv.reader(f) found = [] for line in content: if isinstance(word, str): if word in line: found.append(line) else: if len(set(word) & set(line)) == len(word): found.append(line) final = '' for item in found: final += str(item) + '\n' return final if len(found) != 0 else f"'{word}' doesn't exist" → 두번째 인자로 str을 받으면 그 단어를 포함.. 2020. 4. 22.
[Numpy] (6) Array Mathematics HackerRank 문제: https://www.hackerrank.com/challenges/np-array-mathematics/problem Array Mathematics | HackerRank Perform basic mathematical operations on arrays in NumPy. www.hackerrank.com import numpy N,M=map(int,input().split()) A=numpy.array([list(map(int,input().split())) for n in range(N)]) B=numpy.array([list(map(int,input().split())) for n in range(N)]) print(numpy.add(A,B)) print(numpy... 2020. 4. 3.