Konstantin Verner konverner

konst.verner@gmail.com

konverner / create_keyfile_dict.py

Created August 25, 2024 10:03

a function allows to generate json key file used by google api from environment variables

	"""
	A function allows to generate json key file used by google api from environment variables. Example of `.env` file:

	```
	TYPE="my_service_account"
	PROJECT_ID="my_project_id"
	PRIVATE_KEY_ID="my_private_key_id"
	PRIVATE_KEY="-----BEGIN PRIVATE KEY-----
	my_private_key_content
	-----END PRIVATE KEY-----

konverner / spans_to_conll.py

Last active February 5, 2024 12:47

convert spans NER annotation to conll BIO format

	import json
	from typing import Any, Dict, List

	import spacy
	from spacy.training.iob_utils import biluo_to_iob, doc_to_biluo_tags
	from tqdm import tqdm


	def spans_to_conll(
	samples: List[Dict[str, Any]],

konverner / fix_ner_spans.py

Created February 1, 2024 00:00

fix corrupted spans in NER annotation

	def fix_span(text: str, span: dict):
	# let us check that spans are correctly extracted

	fixed_span = span.copy()

	# span starts with a space or a punctuation
	while text[fixed_span["start"]] in [" ", ".", ",", ";", ":", "!", "?"]:
	fixed_span["start"] += 1

	# span is cut in the begging: e.g. "ashington DC"

konverner / generate_ssh.sh

Created December 18, 2023 21:06

generate ssh key on linux

	mkdir -p ~/.ssh
	ssh-keyscan -t rsa github.com >> ~/.ssh/known_hosts
	ssh-keygen -t rsa -C <email>
	cat ~/.ssh/id_rsa.pub

konverner / ols_template.py

Last active November 10, 2023 21:03

OLS method with statsmodels

konverner / changePython.sh

Created July 8, 2023 21:20

Change python version in Colab

	!sudo update-alternatives --install /usr/bin/python3 python3 /usr/bin/python3.8 1
	!sudo update-alternatives --config python3
	!sudo apt install python3-pip
	!python3 --version

konverner / stacked_barplot.py

Created June 17, 2023 20:42

stacked barplot from dataframe

	import pandas as pd


	df = pd.DataFrame({'name': ['Store A', 'Store B', 'Store C', 'Store D']
	'district': ['I', "II", "I", "III"],
	"category": [X, X, Y, Z]
	}
	)

	district_category_pivot_table = df.pivot_table('name', 'district', 'category', aggfunc='count')

konverner / show_percent_nans.py

Last active June 15, 2023 21:06

show percent of nan values

	import pandas as pd


	df = ...

	pd.options.display.float_format = '{:,.1f}%'.format
	print((df.isna().sum()/df.shape[0]).sort_values(ascending=False)*100)
	pd.options.display.float_format = '{:,.2f}'.format

konverner / wordcloud_pandas.py

Last active June 16, 2023 22:15

create world cloud from dataframe column

	from wordcloud import WordCloud


	def create_wordcloud_from_column(df, column_name, title, max_token_len=3):
	preprocessed_tokens = []
	for tokens in df[column_name].str.split().tolist():
	try:
	for token in tokens:
	if len(token) > max_token_len:
	preprocessed_tokens.append(token.lower().strip().strip('-').strip('.'))

konverner / mnist_pytorch_pipeline.py

Last active May 28, 2023 22:15

Template for image classification with pytorch on mnist

	import torch
	import torch.nn as nn
	import torch.optim as optim
	from torch.utils.data import DataLoader
	from torchvision.datasets import MNIST
	from torchvision.transforms import ToTensor
	from tqdm import tqdm

	# Set device (GPU or CPU)
	device = torch.device("cuda" if torch.cuda.is_available() else "cpu")