Python
-
머신러닝 라이브러리 중 가장 많이 사용되는 라이브러리로 최근에는 케라스나 텐서플로 등 딥러닝 라이브러리에 의해 밀렸지만 여전히 많은 데이터분석가가 사용하는 라이브러리이다. 사이킷런의 장점 3가지: 쉽다, 편리하다, 성숙하다(많은 검증을 거쳐왔다.) 설치과정은 아나콘다를 설치했다면 사이킷런은 기본으로 설치가 되어 있기 때문에 생략하겠다. 이제 사이킷런으로 간단한 머신러닝 모델을 만들어보자 사이킷 런 기본 내장 데이터셋인 붓꽃 데이터 세트를 이용해서 만들어볼거다. 해당 모델은 꽃잎의 길이와 너비, 꽃받침의 길이와 너비 피쳐를 기반으로 곷의 품종을 예측(분류)하는 모델이다. 바로 코드를 보고 이해해보자 아래는 기본적인 모듈을 불러온 모습니다. load_iris를 통해서 붓꽃 데이터를 불러오고 DecisionT..
사이킷런과 간단한 붓꽃 품종 예측하기머신러닝 라이브러리 중 가장 많이 사용되는 라이브러리로 최근에는 케라스나 텐서플로 등 딥러닝 라이브러리에 의해 밀렸지만 여전히 많은 데이터분석가가 사용하는 라이브러리이다. 사이킷런의 장점 3가지: 쉽다, 편리하다, 성숙하다(많은 검증을 거쳐왔다.) 설치과정은 아나콘다를 설치했다면 사이킷런은 기본으로 설치가 되어 있기 때문에 생략하겠다. 이제 사이킷런으로 간단한 머신러닝 모델을 만들어보자 사이킷 런 기본 내장 데이터셋인 붓꽃 데이터 세트를 이용해서 만들어볼거다. 해당 모델은 꽃잎의 길이와 너비, 꽃받침의 길이와 너비 피쳐를 기반으로 곷의 품종을 예측(분류)하는 모델이다. 바로 코드를 보고 이해해보자 아래는 기본적인 모듈을 불러온 모습니다. load_iris를 통해서 붓꽃 데이터를 불러오고 DecisionT..
2022.08.02 -
axis에 대해서 조금 더 자세히 알아보자 axis를 행과 열이라고 알고 있는 사람들이 많다. 사실 완전히 틀린말은 아니지만 엄밀히 말하면 다르다. axis는 축이 지 행과 열이 아니다. 2차원 ndarray에서는 행과 열이 축이 되겠지만 다차원에서는 행과 열만이 축이 되지 않기 때문에 일정수준 머신러닝과 딥러닝을 공부했다면 차이를 알고 있어야 한다. 아래 사진을 보자 가장 왼쪽에 있는 3×3 형태의 2차원 ndarray는 두개의 축을 가지고 있다. axis=0
넘파이 ndarray의 axis축(axis≠행열)axis에 대해서 조금 더 자세히 알아보자 axis를 행과 열이라고 알고 있는 사람들이 많다. 사실 완전히 틀린말은 아니지만 엄밀히 말하면 다르다. axis는 축이 지 행과 열이 아니다. 2차원 ndarray에서는 행과 열이 축이 되겠지만 다차원에서는 행과 열만이 축이 되지 않기 때문에 일정수준 머신러닝과 딥러닝을 공부했다면 차이를 알고 있어야 한다. 아래 사진을 보자 가장 왼쪽에 있는 3×3 형태의 2차원 ndarray는 두개의 축을 가지고 있다. axis=0
2022.07.27 -
numpy에 대해 알아보자 numpy의 기본 단위는 ndarray 객체이다. ndarray란!? ndarray: n차원(Dimension) 배열(Array)객체 라는 뜻으로 numpy의 기본 단위다. 차원은 n차원으로 이루어져있는데 n차원은 n-1차원을 기본 단위로 갖는 특성을 가지고 있다. 다음은 ndarray의 기본적인 특징이다. Ndarray내의 데이터 값은 숫자, 문자, 불 값 등이 모두 가능하다. 숫자형의 경우 int형과 unisigned int형(8, 16, 32bit) 그리고 float형 도 가능하고 이보다 더 큰 숫자 값이나 정밀도를 위해 complex 타입도 제공한다. Ndarray내의 데이터 값은 그 연산의 특성상 같은 데이터 타입만 가능하다. 즉, 한개의 ndarray 객체에 int와..
numpy 개요(ndarray와 배열의 타입)numpy에 대해 알아보자 numpy의 기본 단위는 ndarray 객체이다. ndarray란!? ndarray: n차원(Dimension) 배열(Array)객체 라는 뜻으로 numpy의 기본 단위다. 차원은 n차원으로 이루어져있는데 n차원은 n-1차원을 기본 단위로 갖는 특성을 가지고 있다. 다음은 ndarray의 기본적인 특징이다. Ndarray내의 데이터 값은 숫자, 문자, 불 값 등이 모두 가능하다. 숫자형의 경우 int형과 unisigned int형(8, 16, 32bit) 그리고 float형 도 가능하고 이보다 더 큰 숫자 값이나 정밀도를 위해 complex 타입도 제공한다. Ndarray내의 데이터 값은 그 연산의 특성상 같은 데이터 타입만 가능하다. 즉, 한개의 ndarray 객체에 int와..
2022.07.27