Wassim is available for hire

Wassim Seifeddine

Verified Expert in Engineering

机器学习开发人员

Location

Paris, France

至今成员总数

September 23, 2022

Wassim是一名拥有7年以上经验的软件工程师，其中包括4年以上的机器学习经验. 他与各种各样的客户合作，从初创公司到研究机构再到跨国公司. Wassim从人群中脱颖而出，因为他对构建适应业务需求的可伸缩解决方案了如指掌.

Algorithms Machine Learning Computer Vision 人工智能(AI)云架构 Deep Learning Data Visualization AI Design 深度神经网络 CTO Data Inference Analytics 自然语言处理(NLP)移动应用开发 Data Analytics

Portfolio

Animaj

PyTorch，数据湖，数据仓库，趋势预测，主题建模...

1Bstories

人工智能(AI)，机器学习，稳定扩散，文本到图像...

富柠檬应用程序FZE有限责任公司

人工智能(AI)，机器学习，稳定扩散...

Experience

人工智能(AI) - 5年计算机视觉- 5年机器学习- 5年优化- 4年深度学习- 4年自然语言处理(NLP) - 3年生成预训练变形金刚(GPT) - 3年 GPT - 3 years

Availability

Part-time

首选的环境

PyTorch, PySpark, NumPy, Jupyter Notebook, Pandas, 亚马逊网络服务(AWS), GPT, 生成预训练变压器(GPT), 自然语言处理(NLP), Computer Vision, Python, 人工智能(AI), GPU Computing

The most amazing...

...我所建立的项目是一个法律案例分类模型, 对案例描述进行分类并突出显示关键文本元素的系统.

Work Experience

机器学习工程师

2022 - PRESENT

Animaj

培养从文本中提取概念的能力, audio, 以及视频内容，以便更好地了解社交媒体趋势. 概念包括情感、活动和对视频中发生的事情的看法.
开发了一套Apache气流定向无环图(dag)，用于编排数据和机器学习(ML)管道.
创建了一个监控系统，以鸟瞰整个系统.
微调LLMS (gptj), gpt-neox, llama)使用内存和LoRA等省时技术来处理新数据集, DeepSpeed ZeRO, 和PyTorch的FSDP.
生成2D/3D图像和视频使用稳定扩散和其他生成AI模型微调自定义数据集.
在量化模型方面有丰富的经验(研究和工业)，以提高训练和推理的效率.
在使用gRPC服务器和网状网络的分散网络上部署llm.

技术:PyTorch，数据湖，数据仓库，趋势预测，主题建模, 收入预测, Video Analysis, Speech Synthesis, Sound, Text Animation, Diffusion Models, Image Generation, Databricks, Matplotlib, 预测建模, PySpark, NumPy, 深度神经网络, Data Engineering, AI Design, Forecasting, Data Visualization, Algorithms, Data Analytics, OpenAI, OpenCV, 计算机视觉算法, Language Models, OCR, Consulting, Startup Consulting, ETL, Apache Airflow, Data Analysis, 预测分析, SQL, GPT-Neo, 谷歌发布者标签(GPT), Statistics, Python 3, Datasets, Causal Inference, Fine-tuning, Data Inference, Text Generation, Scikit-learn, Programming, 亚马逊网络服务(AWS), Speech Recognition, Architecture, Web Development, Snowflake, Analytics, AWS Lambda, NoSQL, Amazon EKS, Bash, Docker, MySQL, XGBoost, 大型语言模型(llm), AWS ELB, Amazon弹性容器服务(Amazon ECS), AWS Fargate, API Integration, GPT-4, OpenAI GPT-3 API, Data Management, YouTube API, Youtube Ads, Optimization, Videos, Stable Diffusion, ControlNet, LoRa, 分布式计算, Amazon DynamoDB, Apache Spark, Spark, 生成预训练变压器3 (GPT-3), OpenAI GPT-4 API, 软件架构, 图形处理器(GPU), 卷积神经网络, Image Analysis, 机器学习操作(MLOps), GPU Computing, 云架构, Models

AI/ML Expert

2023 - 2023

1Bstories

开发了一个系统，生成基于多个用户选择的逼真的虚拟人物与TTS模型一起使用.
建立了一个场景生成管道，根据特定的描述和偏好生成图像.
将MLflow部署到生产环境，以监控所有正在进行的机器学习模型推断.

Technologies: 人工智能(AI)，机器学习，稳定扩散，文本到图像, Text to Video, MLflow, Midjourney, Avatars, Image Generation, Models

AI/ML Specialist

2023 - 2023

富柠檬应用程序FZE有限责任公司

训练AI模型生成特定风格的用户头像，同时保留面部特征.
与之前使用Dreambooth的方法相比，取得了显著的改进, 导致头像与原始面孔非常相似.
运用强大的AI/ML知识, Python, LoRA, diffusion models, stable diffusion, 和图像处理来完成项目目标.

Technologies: 人工智能(AI)，机器学习，稳定扩散, Image Processing, Fine-tuning, Python, ControlNet, LoRa, DreamBooth, Kohya, 卷积神经网络, Image Analysis, GPU Computing, Models

机器学习工程师

2023 - 2023

火星学习公司.

帮助调试自定义深度学习模型的评估问题.
与一组人工智能研究人员一起调试模型路由器的性能.
在GPU集群上运行模型进行训练和评估.

技术:机器学习, 人工智能(AI), Python, PyTorch, 分布式计算, 机器学习操作(MLOps), GPU Computing, Models

机器学习工程师

2023 - 2023

Odem全球有限公司

微调llm以部署到分散的区块链.
开发了一个gRPC服务器，将推理卸载到远程服务器.
提高了先进llm的推理速度，以便部署在资源受限的服务器上.

技术:语言模型, Machine Learning, Python, PyTorch, Fine-tuning, Causal Inference, Flash Attention, APIs, OpenAI GPT-3 API, 图形处理器(GPU), 卷积神经网络, Image Analysis, 机器学习操作(MLOps), GPU Computing, 云架构, 项目管理, Models

AI Developer

2023 - 2023

CodeComplete, Inc

从事因果语言模型加速的优化.
探索新概念，利用该领域最先进的技术来提高性能.
进行深入的分析和实验，以确定潜在的瓶颈，并开发创新的解决方案，以优化语言模型的性能.
了解语言建模领域的最新进展，探索其适用性，进一步提高因果语言模型的加速和整体效率.

Technologies: C++, Machine Learning, 人工智能(AI), NVIDIA CUDA, PyTorch, cuBLAS, Flash Attention, gRPC, 生成预训练变压器(GPT), 生成预训练变压器3 (GPT-3), 软件架构, 图形处理器(GPU), 机器学习操作(MLOps), 云架构, Models

OCR AI Developer

2023 - 2023

ACFT PERFO

实现了一个使用AWS extract从PDF文件中提取结构化数据的解决方案.
开发端到端管道，用于提取数据并将其保存到数据湖中.
提供替代解决方案和工具，以提高数据提取过程的效率和准确性.

技术:Amazon text, 亚马逊网络服务(AWS), Amazon SageMaker, OCR, 人工智能(AI), Python, Machine Learning, Amazon S3 (AWS S3), Python 3, Consulting, 软件架构, 卷积神经网络, Image Analysis, 项目管理, Models

高级AI b|技术b|人力资源顾问

2023 - 2023

Block Born LLC

为AI工具提供建议，根据模式和规模为游戏内容生产提供创造性建议.
审查并提供与实施AI工具有关的创意内容建议的反馈.
在人工智能及其在创意内容生成中的应用方面表现出深厚的专业知识.

技术:人工智能(AI), Consulting, ChatGPT, Plugins, GPT-4, APIs, OpenAI GPT-3 API, Stable Diffusion, ControlNet, 生成预训练变压器3 (GPT-3), OpenAI GPT-4 API, 卷积神经网络, Image Analysis, 机器学习操作(MLOps), 云架构, 项目管理, Models

机器学习工程师

2023 - 2023

广告营销有限责任公司

为社交媒体优化产品广告算法.
研究改进视频产品植入的技术.
探索视频生成建模的深度学习技术.

技术:机器学习, Python, PyTorch, TensorFlow, Deep Learning, Diffusion Models, Generative Models, 图形处理器(GPU), 卷积神经网络, Image Analysis, 机器学习操作(MLOps), 云架构, 项目管理, Models

具有GPT-2/3技能的机器学习工程师

2022 - 2023

Toptal

训练了一个gpt风格的模型，用于部署在位张量网络上的简单语言建模.
配置一个迭代过程，从以前的检查点在新数据集上训练模型.
在培训期间和培训后监控模型的性能，以了解何时需要重新培训.

技术:机器学习, Deep Learning, Python, Text Generation, Language Models, Blockchain, 生成预训练变压器(GPT), GPT, 自然语言处理(NLP), 分布式计算, 生成预训练变压器3 (GPT-3), OpenAI GPT-4 API, 软件架构, 图形处理器(GPU), 机器学习操作(MLOps), 云架构, 项目管理, Models

首席机器学习工程师

2021 - 2023

Quantum Analytica

曾在一家房地产初创公司担任创业顾问，帮助他们更好地了解数据基础设施，并指导他们使用ETL管道使用正确的工具, data lakes, delta tables, and hot storage.
开发了一套完整的PySpark etl用于转换, cleaning, 对来自不同数据源和行业的数据进行规范化, 包括房地产和农业.
使用来自不同提供商的客户级数据和奖励数据，为一家早期初创公司构建了一个个性化的基于机器学习的员工奖励模型，作为MVP.
管理技术团队，包括为整个团队设计架构. 架构范围从带有动态代理的web抓取器到热存储数据, 准备好被REST api使用.
为零售领域的消费者需求预测者开发机器学习模型，专注于优化分销以避免缺货.
研究一种算法，用于预测消费者对特定产品的需求，以帮助我们的客户战略性地进入新市场.

技术:PyTorch, ETL, PySpark, REST APIs, NumPy, Jupyter Notebook, Pandas, Machine Learning, Computer Vision, Python, 人工智能(AI), 推荐系统, Data Science, Image Processing, Advisory, Databricks, 深度神经网络, Matplotlib, Data Engineering, AI Design, Forecasting, Data Visualization, APIs, Algorithms, Data Analytics, OpenAI, 预测建模, OpenCV, 计算机视觉算法, Topic Modeling, Trend Forecasting, Data Warehousing, Data Lakes, Language Models, OCR, Data Scraping, Consulting, 技术咨询, Slurm工作量管理器, Startup Consulting, Apache Airflow, Data Analysis, CTO, 预测分析, SQL, GPT-Neo, 谷歌发布者标签(GPT), Statistics, Python 3, Datasets, DeepSpeed, Causal Inference, Fine-tuning, Data Inference, Text Generation, Scikit-learn, Programming, 亚马逊网络服务(AWS), 定量金融学, Speech Recognition, Architecture, Snowflake, Analytics, NoSQL, Amazon EKS, Bash, Docker, MySQL, XGBoost, Image Recognition, 手写识别, 大型语言模型(llm), API Integration, Data Management, 分布式计算, Amazon DynamoDB, Apache Spark, Spark, 数据驱动营销, Pricing Models, 生成预训练变压器3 (GPT-3), OpenAI GPT-4 API, 软件架构, 图形处理器(GPU), 卷积神经网络, Image Analysis, 机器学习操作(MLOps), 云架构, 项目管理, Models

PhD Researcher

2021 - 2022

Nantes Université

Worked on my Ph.D. 用计算机算法研究神经网络的加速问题.
设计新的神经网络训练策略，鼓励低精度的神经网络有更好的表现.
为低级操作和功能近似开发自定义CUDA操作.
参加与机器学习和计算机算术相关的会议和研究学校.

技术:PyTorch, Arithmetic, Neural Networks, NumPy, Jupyter Notebook, Pandas, Machine Learning, Python, 人工智能(AI), C++, Data Science, Image Processing, 深度神经网络, Matplotlib, AI Design, Algorithms, 物联网(IoT), Slurm工作量管理器, Data Analysis, Statistics, Python 3, Datasets, DeepSpeed, Causal Inference, Fine-tuning, Data Inference, Scikit-learn, Programming, Bash, NVIDIA CUDA, Docker, Image Recognition, 手写识别, 软件架构, 图形处理器(GPU), 卷积神经网络, Image Analysis, 机器学习操作(MLOps), 项目管理, Models

Research Intern

2021 - 2021

Inria

参与一个研究项目，使用早期退出网络在小型资源受限设备上运行大型机器学习模型.
与两位教授合作，对模型压缩技术进行文献综述, 包括量子化, pruning, 知识的提炼.
在一个国际会议上发表论文，并在会上介绍工作成果.

技术:PyTorch, 深度神经网络, Microsoft Edge, NumPy, Jupyter Notebook, Pandas, Machine Learning, Computer Vision, Python, 人工智能(AI), C++, Data Science, Image Processing, Matplotlib, AI Design, Algorithms, OpenCV, 计算机视觉算法, 物联网(IoT), Slurm工作量管理器, Statistics, Python 3, Datasets, Causal Inference, Fine-tuning, Data Inference, Scikit-learn, Programming, Bash, Docker, API Integration, 图形处理器(GPU), 卷积神经网络, Image Analysis, Models

机器学习工程师

2020 - 2020

Navya

使目标检测模型更快，更轻，能够在伪实时运行中部署在自动驾驶汽车上.
与核心机器学习团队密切合作，以确保我们在实验设置和结果上保持一致.
尝试了多种模型压缩策略，如修剪, quantization, 并编制评价各方法的有效性.
将模型压缩约4倍，推理速度提高3倍，同时保持与原始模型相同的性能.

技术:PyTorch, Computer Vision, Object Detection, Quantization, NumPy, Jupyter Notebook, Pandas, Python, 人工智能(AI), Data Science, Image Processing, Advisory, 深度神经网络, Matplotlib, AI Design, Data Visualization, APIs, Algorithms, Data Analytics, 预测建模, OpenCV, 计算机视觉算法, Consulting, 预测分析, Statistics, Python 3, Datasets, Causal Inference, Fine-tuning, Scikit-learn, Programming, Web Development, Analytics, Bash, Docker, MySQL, XGBoost, Object Tracking, Image Recognition, 手写识别, API Integration, 软件架构, 图形处理器(GPU), 卷积神经网络, Image Analysis, 云架构, 项目管理, Models

Data Scientist

2020 - 2020

SannSyn

开发了一个系统，可以根据行业专家输入的原始文本对法律案件进行分类. 给出的数据是从在线资源中提取的原始数据和OCR pdf.
对非结构化数据进行数据分析，以了解如何处理数据以及提高质量所需的流程.
建了一个刮网器来刮财经新闻.
使用基于转换器的模型为财经新闻文章提供情感分析功能.

技术:PyTorch, Sentiment Analysis, 文本分类, NumPy, Jupyter Notebook, Pandas, Machine Learning, Computer Vision, Python, 人工智能(AI), Data Science, Image Processing, PySpark, 深度神经网络, Matplotlib, Data Visualization, APIs, Algorithms, Data Analytics, 预测建模, OpenCV, 计算机视觉算法, Data Scraping, 预测分析, SQL, Statistics, Python 3, Datasets, Fine-tuning, Data Inference, Scikit-learn, Programming, 亚马逊网络服务(AWS), NoSQL, Bash, Docker, MySQL, XGBoost, API Integration, 软件架构, 机器学习操作(MLOps), 云架构, 项目管理, Models

机器学习工程师

2019 - 2019

Tedmob

使用RASA AI开发面向客户的聊天机器人, Dialogflow, 以及Microsoft bot框架，用于一家领先的电信运营商，用于处理常见问题和与OTP身份验证和第三方集成相关的帐户问题.
使用各种工具实时跟踪问题，如Sentry、ELK stack和Docker监控工具.
处理与客户的会议，并收集各种团队需求，以达到最佳的发布过程.

技术:PyTorch, Machine Learning, Chatbots, 推荐系统, TensorFlow, PySpark, NumPy, Jupyter Notebook, Pandas, Computer Vision, Python, 人工智能(AI), Data Science, Image Processing, Advisory, 深度神经网络, Matplotlib, Algorithms, OpenCV, 计算机视觉算法, Consulting, 技术咨询, SQL, Statistics, Python 3, Datasets, Fine-tuning, Scikit-learn, Programming, 亚马逊网络服务(AWS), Speech Recognition, Web Development, NoSQL, Bash, Docker, API Integration, Amazon DynamoDB, 谷歌云平台, 软件架构, 卷积神经网络, Image Analysis, 机器学习操作(MLOps), 云架构, 项目管理, Models

iOS部门负责人

2017 - 2019

Tedmob

领导和监督iOS开发团队两年.
管理新员工的招聘和入职流程.
迁移团队技术栈并合并新的软件架构.

技术:快速, Jira, Xcode, Jupyter Notebook, Python, Algorithms, 技术咨询, Programming, NoSQL, API Integration, App Development, 软件架构, 云架构, 项目管理

iOS Developer

2016 - 2017

Tedmob

为从个人创业公司到跨国公司的客户开发商业应用程序.
实时跟踪应用程序端发生的问题，并在下一个版本中解决它们.
将旧的应用程序从Objective-C迁移到Swift.

技术:快速, iOS, Xcode, Algorithms, Mobile Development, 移动应用开发, Programming, NoSQL, API Integration, App Development, 软件架构, 项目管理

Experience

从视频中提取概念

一套完整的机器学习模型，从视频数据中提取概念, 包括成绩单, audio tracks, thumbnails, 还有真实的视频片段.

这些概念包括:

• Emotions
• Activities
• Sentiment
• Objects
• Movement

目标检测的量化神经网络

这项工作是与一家自动驾驶汽车公司合作的项目的一部分. 其目的是采用一个预先训练的模型，并尝试尽可能快地运行它，并尽可能轻地用于实时目标检测.

使用的模型是ImageNet上带有SSDLite对象检测器的MobileNetV2预训练模型. 我们以FP32数据格式训练模型.

我应用了几种模型压缩技术来减小模型的大小并监控其性能.

我们使用的一些方法是:
• Quantization
• Pruning
•融合卷积
•知识蒸馏

这项工作的结论是，该模型可以可靠地检测图像中的物体，其精度与FP32版本相同，同时可以低至INT8数据格式.

随意语言模型微调

在一个要部署在区块链网络上的大型数据集上迭代地微调一个类似gpt的简单语言模型. 训练过程包括使用DeepSpeed进行模型并行，使用权重和偏差服务进行自定义记录器监控.

法律案件分类

这个项目有三个方面:

•对非结构化的凌乱文本数据进行EDA，以了解如何处理这些数据

•建立一个模型，根据输入的描述将法律案件分为几个类别. 这一部分的目的是提供一个工具，帮助律师更快更容易地分类案件.

•从案例描述中提取与分类相关的实体，以帮助反驳.

自定义语言模型培训框架

http://github.com/pegesund/nor_bert

基于转换器的语言模型的数据集不可知训练框架. 这个项目是为了帮助弥合英语和非英语语言模型之间的性能差距. 最终的库应该集成到著名的SentenceTransformer NLP包中，以便直接使用.

多模态文本分类器

从输入流文本数据中提取多个标签的机器学习模型. 我负责从头到尾地建造这个模型. 目标是使用该模型的输出作为另一个分类器的特征.

推特情绪分析

一种文本分类模型，用于对Twitter上的单个tweet或主题标签的情感进行分类, 其中模型是基于转换器的BERT模型，在情感分析数据集上进行微调. 该模型使用Streamlit托管.

在边缘设备上运行神经网络

http://ieeexplore.ieee.org/abstract/document/9664700

我开发了一种新技术，可以通过IoT等多个设备成功执行单个模型的部分, edge, 和云，同时尊重每个设备的资源限制. For that, 我引入了一个新的卸载机制, during computation, 可以决定卸载工作, 以及在计算中使用中间结果提前退出的能力. 决策本身是通过深度q学习来调整的.

挪威情绪分析模型

基于Transformer的神经网络将财经新闻情绪分类为三大类:
• Positive
• Neutral
• Negative.

主要的困难是找到一个好的挪威语标记情感分析数据集，并对现有的多语言模型进行微调.

Skills

Languages

Python, Python 3, Bash, SQL, Snowflake, c++， Swift

Libraries/APIs

PyTorch, NumPy, Pandas, Matplotlib, XGBoost, PySpark, TensorFlow, OpenCV, REST APIs, Scikit-learn, YouTube API, cuBLAS

Paradigms

数据科学，移动开发，ETL，应用程序开发，分布式计算，实时系统

Platforms

Jupyter Notebook, Docker, Databricks, 亚马逊网络服务(AWS), Embedded Linux, iOS, AWS Lambda, NVIDIA CUDA, Blockchain, Microsoft Edge, 谷歌云平台

Storage

NoSQL, MySQL, Amazon DynamoDB，数据湖，Amazon S3 (AWS S3)

Other

Machine Learning, Computer Vision, Sentiment Analysis, Deep Learning, 自然语言处理(NLP), 人工智能(AI), Image Processing, OCR, 计算机视觉算法, 移动应用开发, 预测建模, Algorithms, APIs, Data Analytics, Data Visualization, Forecasting, AI Design, Data Engineering, 深度神经网络, Data Analysis, CTO, 预测分析, Statistics, Datasets, Causal Inference, Fine-tuning, Data Inference, Programming, Architecture, Analytics, Image Recognition, API Integration, GPT, 生成预训练变压器(GPT), 软件架构, 图形处理器(GPU), 卷积神经网络, Image Analysis, GPU Computing, 云架构, Models, Optimization, Consulting, Advisory, 技术咨询, Startup Consulting, Facial Recognition, OpenAI, GPT-Neo, 谷歌发布者标签(GPT), DeepSpeed, Text Generation, Speech Recognition, Web Development, 手写识别, 大型语言模型(llm), Data Management, Stable Diffusion, ControlNet, 机器学习操作(MLOps), 数据驱动营销, 生成预训练变压器3 (GPT-3), OpenAI GPT-4 API, Research, Graph Theory, Arithmetic, Object Detection, Neural Networks, Slurm工作量管理器, Chatbots, 推荐系统, Quantization, Data Scraping, Clustering, 文本分类, 物联网(IoT), Language Models, Data Warehousing, Trend Forecasting, Topic Modeling, 收入预测, Video Analysis, Speech Synthesis, Sound, Text Animation, Diffusion Models, Image Generation, 定量金融学, Object Tracking, Generative Models, ChatGPT, Plugins, GPT-4, OpenAI GPT-3 API, Amazon Textract, Youtube Ads, Videos, LoRa, Flash Attention, Pricing Models, DreamBooth, Kohya, Wearables, Biometrics, 强化学习, Text to Image, Text to Video, MLflow, Midjourney, Avatars

Frameworks

Apache Spark, Spark, Flask, gRPC

Tools

Amazon EKS, Xcode, Jira, Jupyter, Apache Airflow, AWS ELB, Amazon弹性容器服务(Amazon ECS), AWS Fargate, Amazon SageMaker

Industry Expertise

项目管理

Education

2021 - 2022

计算机科学博士学位

南特大学-南特，法国

2019 - 2021

人工智能硕士学位

ESIEE巴黎-巴黎，法国

2014 - 2018

计算机科学学士学位

黎巴嫩大学-贝鲁特，黎巴嫩

Certifications

2020年3月至今

深度学习专业化

DeepLearning.ai | via Coursera

MAY 2019 - PRESENT

高级机器学习专业化

DeepLearning.人工智能和斯坦福在线b|通过Coursera

MAY 2018 - PRESENT

Machine Learning

斯坦福大学b|通过Coursera

2016年7月至今

iOS开发者

Udacity