반응형
반응형

https://www.itworld.co.kr/numbers/82001/270453

 

넘버스 Numbers - 2023년 적용 SW기술자 평균임금 공표

1111Some text as placeholder. In real life you can have the elements you have chosen. Like, text, images, lists, etc.

www.itworld.co.kr

한국소프트웨어산업협회(KOSA)는 21일 서울 포스코센터에서 하반기 소프트웨어(SW) 사업대가 세미나를 개최하고, 2022년 SW기술자 임금실태조사 결과를 공개했다. 
 

ⓒ 한국소프트웨어산업협회
KOSA는 올해 조사직무를 17개로 통합·개편해 조사 용이성을 개선했으며, 표본수집이 어려운 ▲IT PMO ▲IT감사 ▲IT교육강사는 조사대상에서 제외했다. 또한 모집단을 기존 SW 사업자신고 기업에서 SW사업을 영위하는 기업으로 확대해 소규모 비활성 기업에 대한 정비 및 개선을 추진했다.

KOSA는 개선사항을 반영해 올해 8월부터 약 두 달간 2022년 SW기술자 임금실태조사를 진행했고, 그 결과 SW기술자 일 평균임금은 전년대비 6.9% 증가한 35만1,443원이다.
 


이번 조사는 SW사업을 영위하는 1,092개 기업에서 근무하는 41,062명의 SW기술자의 임금 현황을 조사한 결과다. 평균임금은 SW기업이 직원에게 제공하는 경비로서 급여성 항목인 기본급, 제수당, 상여금, 퇴직급여충당금 외에도 비급여성 항목인 법인부담금(4대보험)이 포함됐다.

KOSA 조준희 회장은 “올해 조사 결과는 협회가 추진한 개선 활동과 더불어, 비대면·플랫폼 서비스, 게임업 강세 등의 영향이 반영된 것이며, SW기술자 확보를 위한 기업들의 노력이 전반적인 임금 상승에 영향을 미친 것으로 파악된다”며, “앞으로도 국가승인통계 운영기관으로서 통계품질 제고를 위해 연구와 산업계 의견을 수렴하며 지속적으로 노력하겠다”고 밝혔다. 
 

ⓒ 한국소프트웨어산업협회

KOSA는 이번 세미나에서 SW기술자 평균임금을 공표하고 올해 추진한 사업대가 개선 연구의 결과를 소개했다. 정보통신산업진흥원에서는 SW 공정경쟁 시장환경 조성에 대한 계획을 발표했다.

반응형
반응형

https://www.itworld.co.kr/news/273961

 

[ITWorld 넘버스] 한국vs미국, 연봉으로 보는 개발자의 가치

한국에서는 개발자의 처우가 낮다는 비판이 많다. 특히 미국과 비교하며 인재 양성을 위해서라도 개발자의 임금을 높여야 한다고 목소리가 항상 들리고

www.itworld.co.kr

한국에서는 개발자의 처우가 낮다는 비판이 많다. 특히 미국과 비교하며 인재 양성을 위해서라도 개발자의 임금을 높여야 한다고 목소리가 항상 들리고 있다. 그런데 문제는 적절한 개발자 연봉에 대한 기대가 사람마다 다르다는 것이다. 개발자 유무와 상관없이 어떤 사람은 개발자는 기업의 핵심 인재이자 고연봉자라고 생각하기도 하고, 어떤 사람은 낮은 임금을 받으며 야근에 시달리는 직원이라고 보기도 한다. 그렇다면 연봉 기준 실제로 한국 개발자의 수준은 어디까지 와있을까? 마침 2022년 국내외 개발자의 연봉을 확인할 수 있는 다양한 통계가 나왔다. 
 

ⓒ ITWorld *한국 수치는 사람인, 미국 수치는 하이어드(15만 6천만달러) 기준으로 표기
국내의 경우 연봉 수치를 가장 많이 볼 수 있는 곳은 구직 플랫폼이다. 구직 플랫폼 업체들은 직접 사용자가 직접 입력한 데이터를 활용하거나, 국민연금 납부액을 역산하여 계산하거나, 공시자료를 기반으로 연봉을 추산한다. 먼저 사람인은 2022년 기준 IT 전체 산업(IT·웹·통신) 종사자의 평균 연봉은 7,587만 원이라고 밝혔다. 같은 통계에서 가장 높은 연봉을 받는 분야는 금융업이었고, 그 뒤를 IT업계가 바짝 따라잡고 있다고 설명했다. 그와 달리 크레딧잡 데이터를 보면, IT  및 과학 기술 분야의 연봉 평균은 약 3,700만 원으로 나타났다. 

잡플래닛은 IT 업종 종사자 중 개발자 직군의 연봉 정보만 따로 공개했다. 여기서는 1년 차 입사자 평균 연봉은 3,411만 원, 10년 차 입사자는 5,830만 원이라고 소개됐다. 잡플래닛은 “IT 업종은 같은 연차라도 연봉 차이가 크다. 기업 및 세부 직무별로 연봉이 천차만별인 게 특징”라고 강조했다. 해당 자료에서 말하는 개발자란 모바일 앱 개발, 웹 개발, 소프트웨어 엔지니어, 소프트웨어 아키텍트, 하드웨어 엔지니어, 시스템 엔지니어, 네트워크 보안운영자, QA, 데이터 분석가 등을 포함했는데, 그중에서 ‘소프트웨어 아키텍트'의 평균 연봉이 가장 높은 것으로 나왔다. 

한국소프트웨어산업협회(KOSA)는 SW 기술자에 대해 집중적으로 평균 임금을 추적하고 있다. KOSA는 실제 업계 현황 데이터를 받아 자료를 만든다. 
 

      (2023년 적용 SW기술자 평균임금 공표, KOSA)

KOSA에 따르면, 2022년 SW 기술자 일 평균 임금은 351,443원으로 전년 대비 6.9% 증가했다. 사실 이 데이터는 자세히 살펴봐야 한다. 얼핏보면 일 임금이니 업무일 20일을 더 곱해 월급이 약 723만원이라고 생각할 수 있으나, 이는 잘못된 해석이다. 여기서 말하는 일 평균 임금에는 한사람에 대한 기본급, 상여금 외에 법인 부담금도 포함됐다. 그런 의미로서 KOSA의 데이터는 특정 기업이 정부와 사업 계약을 할 때, 소프트웨어 인력 및 전체 진행비를 계산할 때 참고하는 자료다. 물론 KOSA의 자료가 실제 개발자 연봉 평균 데이터와 완전히 동떨어졌다고 표현할 수는 없지만 실제 평균 임금보다 더 높을 가능성이 높다.

다만 KOSA의 자료는 SW 기술자의 임금 평균을 세부적으로 나눴는데, 여기에는 IT 기획자, 디자이너, 컨설턴트부터 데이터 분석가, 개발자, 응용SW 개발자 등이 모두 포함한다. 이런 수치로 직군별 대우 차이를 확인할 수 있는데, 가장 높은 임금을 받는 직군은 ‘IT 아키텍트’였다. 

신입 개발자 또는 작은 기업 소속된 개발자의 연봉을 가늠할 수 있는 통계도 하나 있다. 개발자 평가·채용·교육 플랫폼 업체 그렙은 매년 설문조사를 통해 인기 프로그래밍 언어와 처우를 공개하고 있다. 특히 2022년 설문조사 결과에 따르면 56.5%의 응답자가 연 4,000만원에 미치지 못하는 임금을 받았다. 응답자 50%가 3년 차 미만 개발자이고 20대였다는 점에서 신입 개발자의 대우를 확인할 수 있는 자료라고 볼 수 있다. 

이번에는 개발자의 천국, 미국의 데이터를 분석해보자. 미국의 IT 직종 연봉 정보는 한국보다 세부적인 수치를 확인할 수 있다. 미 컨설팅 업체 잰코 어소시에이츠(Janco Associates)가 펴낸 ‘IT 임금 조사’에 따르면, 2021년 기준 대기업 기술 인력의 평균 연봉은 약 10만 달러, 중소기업은 약 9만 5,681달러였다. IT 경영진의 평균 연봉은 18만 달러였다. 해당 자료에는 경기 침체로 대기업 종사자의 연봉은 상승세가 주춤하고 있으나, 중소기업의 연봉은 대기업보다 빠르게 상승하고 있다고 지적했다. 대기업과 중소기업의 임금 격차가 큰 한국에서 주목할 만한 데이터다.

구직 플랫폼 업체 하이어드 역시 미국 내 소프트웨어 엔지니어의 평균 급여는 지속적으로 증가하는 추세이며, 2021년 기준 평균 연봉은 15만 6,000달러라고 밝혔다. 여기서 흥미로운 것은 원격 근무 형태가 연봉에 영향을 주고 있다는 점이다. 같은 하이어드 보고서에서 원격근무를 하는 소프트웨어 엔지니어 평균 연봉은 15만 7,000달러로 사무실 근무 직원보다 1,000달러 더 높았다. 하이어드는 2022년 말 펴낸 또 다른 보고서에서 “IT 기업에 종사하는 재택 근무자는 사무실 출근 직원보다 평균 3,000달러 더 높은 연봉을 받고 있다”고 밝혔다.
 

     (2022년 IT 업계 임금 실태조사, Hired)

핀테크 스타트업 카르타(Carta)는 재택근무 트렌드가 지역별 임금의 상향 평준화를 이끌고 있다는 자료를 공개했다. 과거 개발자는 실리콘벨리 지역에 가야만 최고 몸값을 받을 수 있었지만, 이제 타 지역에서도 재택근무 형식으로 일하면서 실리콘벨리 만큼 높은 임금을 받을 수 있다는 것이다. 카르타는 동시에 스타트업 근무자의 연봉도 높아지고 있다는 점에 주목했다. 카르타에 따르면, 스타트업에 다니는 엔지니어의 연봉 중앙값은 15만 달러였다. IT 직무뿐만 아니라 재무, 법무, 전략 기획 업무 직원도 미국 스타트업 업계에서는 높은 임금을 받고 있었다.

요약하자면, 한국 개발자의 평균 연봉은 7,000만원대, 신입의 경우 3,000~4,000만원 수준이다. 미국 개발자 연봉은 평균 15만 달러가 넘으나, 지역이나 회사 규모에 따라 연봉 차별을 크게 받지 않는다는 특징이 있다. 혹시 이런 수치를 보고 IT 업계에 진출하거나 직군을 바꾸고 싶은 사람도 있을 것이다. 하지만 높은 연봉에 너무 혹하지 말자. 아무리 개발자 수요가 많다 한들 소위 말하는 대퇴직 시대 아닌가. 연봉이 높은 것으로 유명한 글로벌 IT기업에서도 퇴사자가 우후죽순으로 나오고 있는 것도 사실이다. 그런 면에서 IT 직무의 빛과 그늘을 조명한 기사는 미래를 현실감 있게 준비하는 데 도움이 될 것이다.
 



원문보기:
https://www.itworld.co.kr/news/273961#csidxeb5a405188a9d2aa88ecba8831eccf1 

반응형
반응형

[python] Python 3.11: 진정으로 즐길 수 있는 새로운 기능

https://towardsdatascience.com/python-3-11-new-features-that-you-will-truly-enjoy-9fd67882fdf

 

Python 3.11 New Features That You Will Truly Enjoy

Kudos to all the effort by volunteers across the world

towardsdatascience.com

이미지 출처: Unsplash

Python 3.11은 2022년 10월 24일에 출시되어 우리가 만져볼 수 있는 몇 가지 흥미로운 개선 사항을 제공했습니다. 여기에서 모든 PEP 의 전체 문서를 볼 수 있습니다 . 이 기사에서는 5가지와 추가로 여러분이 높이 평가할 멋진 새 기능을 제공할 것입니다.

PEP 657 : 오류 추적 로케이터

Python 3.11 이전에는 예외가 발생했을 때 오류 추적의 유일한 정보는 오류가 무엇인지 설명 하는 줄 이었습니다. 예를 들어,

x, y, z = 1 , 2 , 0
 a, b, c = 3 , 4 , 5
 결과 = (x / y / z) * (a / b / c)

이 코드는 0과 같은 나누기 때문에 오류를 발생시킵니다. X/Y by Z다음은 이치에 맞는 오류 메시지이지만 코드의 어느 부분이 이 문제를 일으켰는지 아직 모르기 때문에 정보가 아닙니다.

Python 3.11에서 우리는 이것을 보게 될 것입니다.

오류 탐지기의 도움으로 근본 원인이 Y 또는 Z가 0~~^~~ 이라는 것이 분명합니다 . 이 주석이 달린 트레이스백은 코드가 복잡해지면 더욱 강력해집니다.

PEP 673 : 자아 유형

유형 힌트의 경우 이전에는 현재 클래스 자체를 참조해야 하는 경우 아래와 같이 유형 변수 를 명시적으로 정의해야 했습니다.

이제 3.11에서는 Self 캡슐화 클래스 자체를 참조하는 유형을 사용할 수 있습니다. 이렇게 하면 유형 변수를 정의하는 번거로움이 사라집니다.

향상된 {asyncio} : 비동기 컨텍스트 관리자

비동기 프로그래밍을 사용하면 코드는 여전히 한 번에 한 단계씩 실행되지만 시스템은 다음 단계로 이동하기 전에 이 단계가 완료될 때까지 기다리지 않습니다.

파이썬에서 이것은 {asyncio}모듈에 의해 처리됩니다. 우리는 여러 비동기 작업을 생성하고 각 작업이 실행될 때까지 기다린 다음 asyncio.gather(). 예를 들어 심부름을 해보자.

 

터미널에서 실행하면 다음과 같은 결과가 나타납니다.

그러나 list 작업을 기다리기 전에 수동으로 모니터링하는 asyncio.gather것은 번거롭습니다. 새로운 기능/클래스 TaskGroup()가 3.11에 도입되었습니다.

 

TaskGroup종료 시 모든 작업을 기다리는 작업 그룹을 보유하는 컨텍스트 관리자로 기능합니다 . 또한 구문이 더 간단합니다.

PEP 654 : 예외 그룹

예외 처리를 위한 유사한 "그룹화" 기능은 3.11에 추가된 예외 그룹 입니다. 단일 예외에 래핑된 여러 일반 예외로 생각할 수 있습니다.

볼 수 있듯이 오류가 를 트리거하면 ExceptionGroup자체 패널에 표시된 두 하위 예외가 모두 발생했습니다.

처리 하기 위해 ExceptionGroup Python 3.11에는 새 키워드도 추가되었습니다 except*.

를 사용하면 except*에 래핑된 여러 오류 ExceptionGroup 가 처리됩니다. 이 기능은 여러 비동기 작업이 함께 실행되는 { asyncio } 에서 사용될 때 더 효과적입니다.

PEP 678 : 사용자 지정 예외 사항

add_note오류 처리를 위한 또 다른 훌륭한 새 기능은 사용자 지정 메시지를 추가할 수 있는 예외 메모입니다 . 예를 들어,

보너스 PEP 659 : 더 빠른 실행 속도

존경하는 가작으로 Python 3.11은 Faster CPython 이니셔티브 덕분에 이전 버전보다 10%-60% 더 빠를 것으로 예상됩니다.

결론: Python 3.11로 업그레이드해야 합니까?

때에 따라 다르지! 개인적으로 프로젝트에 사용된 특정 라이브러리가 아직 Python 3.11과 호환되지 않을 수 있으므로 프로덕션 환경을 업그레이드하지 않도록 주의 해야 합니다.

테스트해보고 싶다면 Google colab에서 테스트하는 것이 좋습니다. 다음을 실행하여 Python 버전을 3.11로 업그레이드할 수 있습니다.

!sudo apt-get 업데이트 -y 
!sudo apt-get install python3 .11
 !sudo 업데이트 대안 --install /usr/ bin /python3 python3 /usr/ bin /python3 .7  1
 !sudo 업데이트 대안 --install / usr/ bin /python3 python3 /usr/ bin /python3 .11  2

이 기사에서는 가장 흥미로운 새 기능만 살펴보았습니다. 모든 개선 사항 및 변경 사항에 대한 공식 릴리스 문서 를 확인하십시오 .

반응형
반응형

데이터 과학자를 위한 6가지 Python 팁

https://towardsdatascience.com/top-6-python-tips-for-data-scientists-4f4a25e44d15

 

Top 6 Python Tips for Data Scientists

Practical tips and tricks from my daily analytics projects

towardsdatascience.com

 

 

### 데이터 과학자를 위한 6가지 Python 팁
### Top 6 Python Tips for Data Scientists
### https://towardsdatascience.com/top-6-python-tips-for-data-scientists-4f4a25e44d15

codeString = '''a,b = 4,5; print(f"a = {a} and b = {b}"); print(f"a+b = {a+b}")'''
exec(codeString)

print("\n\n\n")


import os
import sys

#작업하는 경로(위치)가 어디인지 확인
print(os.getcwd())


exec(open("./Project/Datascientist/myFullFileName.py").read())

print("\n\n\n")

### 각각 현재 작업 디렉토리 또는 사용자 지정 디렉토리의 모든 파일을 나열합니다.
print( os.listdir() )



"""_summary_
"""
print("\n\n\n")

### 4. Code timer as a decorator 
import time
import requests

def timerWrapper(func):
    """Code the timer"""

    def timer(*args, **kwargs):
        """Start timer"""
        start = time.perf_counter()
        
        output = func(*args, **kwargs)
        
        timeElapsed = time.perf_counter() - start
        print(f"Current function: {func.__name__}\n Run Time: {timeElapsed}")
        return output

    return timer

## Func to make a request to an user-defined url
@timerWrapper
def getArtile(url):
    return requests.get(url, allow_redirects=True)

## Monitor the runTime 
if __name__ == "__main__":
    getArtile('https://towardsdatascience.com/6-sql-tricks-every-data-scientist-should-know-f84be499aea5')
    

print("\n\n\n")
    
## 이제 다른 함수의 시간을 측정 @timeWrapper하려면 함수 앞에 the를 놓는 것뿐입니다.
@timerWrapper
def getMultiplication(num):
    for val in range(num):
        print(10**(10**val))

getMultiplication(3)

Now, let’s jump right in!

  1. Dynamic execution with exec()

Dynamic Execution (Image Source)

Scenario: You inherited a Python project from a colleague, and immediately noticed that those scripts all have a whopping 5000+ lines of code. The same chunks (of code) got copied and pasted multiple times! So, is there a more efficient option to go about code reusability?

Let’s explore the exec() function in Python. Simply put, it takes in a string or object code, and execute it as shown in this example,

 
a = 4 and b = 5
a+b = 9

Even more handy? We can use exec(open().read()) to call and execute a file within the Python interpreter. For example,

 

With this powerful one-liner, data scientists can save programs that will be reused as standalone files, and execute them whenever needed within the main program. No code copying and pasting any more!

Being a cool functionality in Python, exec() has one pitfall to avoid — it does NOT return any value,

 
a = 4 and b = 5
a+b = 9
** Is the return from exec() is None? True **

As we can see, the output of the exec() function is None; hence, it cannot be used to store any values, which is equivalent to the sounce()function in R.

***Join our YouTube community 🎦 “Data Talks with Kat” 😄

 

2. Operating system commands with {os} and {shutil}

Scenario: continue from our previous tip, now you want to check out the script before executing it. Don’t bother to double-click your mouse all the way through to open up the file? No problem, you can easily achieve this in Python directly without interrupting your train of thought.

 

Here, the os.startfile() function allows users to open up any type of files, including MS documents, Excels, R and SQL scripts.

Similarly, we can also delete a FILE using os.remove(“myFullFileName.ANYFORMAT”)

or delete the entire DIRECTORY using shutil.rmtree(“folderToBeRemoved”). where {shutil} is a Python module that offers a number of high-level file operations, particularly for file copying and removal.

Therefore, if you haven’t used {os} other than os.getcwd() or os.chdir() or if the {shutil} sounds unfamiliar, it’s time to check out their documents. You will definitely find useful commands or file system methods that make your coding easier. Here lists a few of my favorites,

  • os.listdir() or os.listdir(“someDirectory”) — list all files in the currently working directory or any user-specified directory, respectively;
  • os.path.join() — automatically create a path with elements in the arguments for later use, e.g., os.path.join(‘D’, ‘Medium’, ‘New Folder’) will return
 ‘D\\Medium\\New Folder’
  • os.makedirs() — create a directory;
  • shutil.copy2(“sourcePath”, “destinationPath”) or shutil.move(“sourcePath”, “destinationPath”) — copy or cut a file respectively.

3. One-liner: Nested list comprehension to get rid of the for loops

Scenario: this “simple” task we come across is to combine several lists into one big long list,

 

Surely, we can write five nested for loops to append each sublist to the final output list. But it’s smarter to turn to nested list comprehension for the most concise way,

 

4. Timer wrapped as a decorator

Timer as a decorator (Image Source)

Scenario: while Python is recognized as one of the most effective programming languages, data scientists still need to check the runtime of our programs.

It’s not the hardest thing if we just implement a bare-bones Python timer for each function we want to monitor. However, if we code it as a decorator, we would make our timer much easier to be version-controlled and reused!

Here is how,

 

In this snippet,

  • the timer is wrapped in a timerWrapper function, which then is used as a decorator called prior to the main function;
  • The example main function is to return a request connecting to an URL, which is one of my previous blogs.

Running this code gives us the time elapsed,

Current function: getArtile
 Run Time: 1.6542516000008618Out[101]: <Response [200]>

Now, to time another function, all we need is to put the @timeWrapper in front of the function,

 
getMultiplication(3)
10
10000000000
10000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000000
Current function: getMultiplication
 Run Time: 0.00014700000065204222

5. Leverage the options system to customize your display

Scenario: as data scientists, we analyze data with {pandas} and {numpy} on a daily basis. When I first learned coding in Python, I was frustrated seeing this after reading my data into the IDE,

Clearly, data display is cut off both row-wise and column-wise, and the following code can fix it,

 

Here, we are explicitly setting the maximum columns, rows and column width to display/print in the console. There are numerous customizable options and settings in {pandas}, and similar operations are also available in {numpy} for arrays and matrix,

 

6. Reproduce your machine learning model results? Set seeds!

Scenario: Due to the stochastic nature of machine learning modeling process, we have all encountered the non-deterministic aspect of machine learning. This randomness results in our difficulty reproducing the same results across different runs. Consequently, it’s challenging to figure out whether an improvement in performance metrics is a result of successful model tuning or simply a different random training/testing sample.

Luckily the reproducibility can be achieved by setting the random seed throughout your model pipeline, provided that you do it correctly! How many times have you seen questions like “Getting a different result despite random seed defined” popping up on Stack Overflow? Well, how to appropriately set seeds should be in the first page of documentations, but it took me some time to dig it out.

I found that NOT every seed is defined the same in {numpy}, {sklearn}, {tensorflow} or {torch}. Thus, it’s a best practice to use a definitive function that sets all SEEDS for all your frameworks. For example,

 

Adding this tactical reset_random_seed() function to all necessary steps of your workflow, such as train-test split, model compile/training, and interpretation, will get you half way to full reproducibility. More detailed visibility into your experiments will finish the second half!

반응형
반응형

데이터 분석가 나도 시작할 수 있을까? (역량, 공부)

 

데이터 분석가가 하는 일은 정확히 무엇일까? 크게 3가지로 요약하면 다음과 같다.

1. 현황을 파악하는 일

2. 현황의 원인을 밝혀내는 일

3. 개선을 위한 시스템을 구축하는 일

예를 들어 이번에 고객 유입 개선을 위한 이벤트를 연다고 해보자. 이 고객 유입과 개선 정도를 파악하기 위해선 평가 지표를 기획하고 대시보드를 만들어야 한다. 이 과정에서 데이터 분석가는 참여 고객을 어떻게 정의할 것인지, 이벤트 화면을 최소 1번 본 사람? 게시물을 공유한 사람? 등을 결정한다.

데이터를 분석하여 논리적으로 설명 가능하도록 결론을 도출하는 것이다. 예를 들어 갑자기 CX문의가 늘었는데 이 원인이 무엇인지 파악하기 위해 다음과 같은 Action을 취한다고 한다.

한 달간 갑자기 CX 문의가 너무 늘어서, 콜센터가 마비가 될 지경입니다.

보험사기를 치는 것 같은 고객을 어떻게 자동으로 적발할 수 있을까?

인스타그램 데이터를 자연어 처리해서 최근 시장 동향을 자동으로 파악할 수는 없을까?

개선을 위한 시스템을 구축하는 일은 위와 같이 더 나아질 수 있는 점을 찾아 해결하는 것이다.

다 종합해보면!! 데이터 분석가는 구체적으로 이런 일을 한다.

  • 문제 확인 & 가설 제작
  • 쿼리 제작 (SQL)
  • 모델링 (머신러닝, 통계 모델링, 비즈니스 모델링 등)
  • 인사이트 정리/시각화 (ppt, notion colab 등)
  • 협업/미팅

3. 데이터 분석가에게 필요한 역량은?

1) 논리적 사고

논리적인 사고는 문제가 주어지면 목표를 설정하고 해결방안과 그 이유를 생각해낼 수 있으며, 그에 따른 결론 또는 성과를 설명할 수 있는 것이다. 논리적 사고가 중요한 이유는 항상 “왜”가 중요하기 때문이다. 데이터 분석가가 도출한 결론에는 꼭 근거가 있어야 한다.

면접을 볼 때도 논리적인 사고는 큰 도움이 된다.

ex) 왜 ~~ 이러한 모델/스코어/기법 등등을 썼나요?

ex) 왜 우리 회사에 지원했나요

2) 꼼꼼함

데이터 분석가에게는 쿼리를 더 효율적으로 짜는 꼼꼼함과 복잡한 현실세계의 데이터를 잘 정리하는 능력이 필요하다.

3) 액션 위주의 사고

액션 위주의 사고라는 게 처음엔 잘 이해가 안 됐는데 이해하고 나니까 내가 평소에 하던 것은 액션 위주의 사고가 아니라는 것을 알았다. 예를 들어 ‘이번 주 가동률은 70%다’라고 인식하는 게 아니라 ‘전해 동기 대비 이번 주 가동률은 3% 낮은 70%’라고 보는 것이 액션을 낼 수 있는 분석이라는 거다.

4) 모델링

해당 모델의 문제가 무엇인지 파악하고, 이를 어떻게 하면 개선할 수 있을지 리소스/상황에 따라 필요에 맞게 생각하는 능력 이번 선배팅에서 계속 강조하셨던 부분은 크게 2가지이다.

1. 논리적, 구조적 사고하기

2. 자신의 주력 도메인을 갈고닦기!

프로그래밍 언어도 여러 개를 하는 것보다 어느 하나를 깊게 파는 것이 좋다고 하는 것처럼 데이터 분석가가 되고 싶다면 자신이 자신 있는, 잘하는 분야를 더 파는 게 중요하다고 한다.

데이터 분석가에도 다양한 유형이 있기 때문에 위의 데이터 분석가의 역량 중 하나만이라도 자신의 강점인 부분을 잘 살려서 준비하면 된다.

 

https://modulabs.co.kr/blog/data-analyst/

 

요즘 잘나가는 데이터 분석가 나도 시작할 수 있을까? (역량, 공부)

4차 산업혁명 시대 큰 주목을 받고 있는 미래 유망 직업 빅데이터 분석가 빅데이터 분석가가 되기 위해 필수적인 요소들을 필수 솔루션을 통해 알아보자.

modulabs.co.kr

 

반응형
반응형

[MSSQL] STRING_AGG(Transact-SQL) 문자열 식의 값을 연결하고 그 사이에 구분 기호 값을 추가합니다. 구분 기호는 문자열 끝에 추가되지 않습니다.

 

https://learn.microsoft.com/ko-kr/sql/t-sql/functions/string-agg-transact-sql?view=sql-server-ver16 

 

STRING_AGG(Transact-SQL) - SQL Server

STRING_AGG(Transact-SQL)

learn.microsoft.com

 

반응형

+ Recent posts