파이썬 데이터 분석 예제

Posted by adminfeira - 2 agosto, 2019 - Sin categoría - No Comments

충분한 이야기, 그것은 데이터를 탐구하고 그것에 대해 찾을 시간이다. 내가 사용하는 데이터는 가상의 슈퍼 스토어에 속합니다. 우리는 판매 측면에서 가장 좋은 날이 무엇인지, 직원이 그에 따라 배치 될 수 있도록 가장 적합한 시간과 같은 몇 가지 질문에 대한 답을 찾을 것입니다. 안녕하세요 쿠날, 당신은 우리에게 더 이상 데이터 세트에 대한 액세스를 제공하지 마십시오? 나는 당신의 튜토리얼을 읽고 데이터 분석을위한 단계를 반복할! 감사합니다, 도리넬 이것은 10 행을 인쇄해야합니다. 또는 데이터 집합을 인쇄하여 더 많은 행을 볼 수도 있습니다. 이제 데이터 프레임은 모두 동일한 차원을 갖습니다! 불행히도 아직 해야 할 일이 많이 남아 있습니다. 데이터가 누락되었는지 확인하고 모든 데이터 프레임의 데이터 유형을 살펴 보겠습니다 : 대부분의 언어와 마찬가지로 파이썬에는 반복에 가장 널리 사용되는 방법인 FOR 루프가 있습니다. 간단한 구문이 있습니다: 이 단계는 다른 데이터 과학 작업과 반복적으로 수행하는 단계입니다: 모델을 빌드하고 유효성을 검사하지만, 그 후에는 기능을 조정하고 모델을 다시 빌드하는 등의 작업을 결정할 수 있습니다. 좋습니다! 이제 두 ACT 데이터 프레임의 `상태` 열의 `국가` 값을 제거해야 한다는 것을 알고 있습니다. 이는 ACT 2018 데이터 프레임에서 중복된 `메인` 값을 찾아 제거하는 데 사용한 것과 동일한 코드를 사용하여 수행할 수 있습니다. 다시 실행하면 다음과 같은 데이터가 표시됩니다: 데이터를 탐색하는 동안 데이터 집합에서 몇 가지 문제를 발견했는데, 이 문제는 데이터가 좋은 모델을 준비하기 전에 해결해야 합니다. 이 연습을 일반적으로 «데이터 머닝»이라고 합니다.

여기에 문제가 있습니다, 우리는 이미 알고있다 : 안녕하세요 쿠날 – 이 유익한 튜토리얼에 대한 첫 번째 오프 감사. 좋은 물건. 불행히도 데이터 집합을 다운로드 할 수 없습니다 – AV에 가입해야하며 가입 시 잘못된 요청을받습니다. 이 자료에 대해 다시 한번 감사드립니다. 이제 파이썬 기본에 익숙해졌으니 한 걸음 더 나아가 보겠습니다. 다음 작업을 수행해야 하는 경우: 켄달 타우 상관 관계는 순위가 매겨진 데이터의 두 열 간의 일치 정도를 나타내는 계수입니다. Spearman 상관 관계를 사용하여 두 변수 간의 연결 정도를 측정할 수 있습니다. 이것들은 서로 매우 비슷해 보입니다, 그렇지 않습니까? 올바른 환경은 필요에 따라 다르지만 개인적으로 iPython 노트북을 많이 선호합니다. 코드 자체를 작성하는 동안 문서화에 대한 많은 좋은 기능을 제공하며 줄 실행이 아닌 블록에서 코드를 실행하도록 선택할 수 있습니다.