Mohab Ayman
Verified Expert in Engineering
数据科学家和人工智能开发者
Mohab是一位数据科学家和机器学习开发人员, 专攻自然语言处理(NLP)和计算机视觉. 他有五年的工作经验, 最近的项目集中在自然语言理解(NLU)领域的机器学习上,, cheminformatics, 自动驾驶汽车. Mohab紧跟深度学习的前沿.
Portfolio
Experience
Availability
首选的环境
Anaconda, PyTorch, Linux, Python
The most amazing...
...我开发的项目是一个深度学习系统,用于配对工作伙伴,根据他们的个人资料的语义相似性为他们的相似目标进行合作.
Work Experience
Data Scientist
Octimine
- 进行生物医学命名实体识别(NER)的研究,用Python开发了一个系统,从法律文本中提取和规范化学实体和疾病.
- 在Node中创建了一个监控系统.Js从登台服务器和生产服务器收集信息. 使用Grafana可视化结果并制作监控仪表板.
- 使用Docker对各种系统组件的外部依赖和运行时进行容器化,以减轻依赖开销并创建更快的开发管道.
研究软件开发工程师
Microsoft
- 基于各种NLU评估指标,在Python中开发了一个自动基准测试管道. 管道以自动化的方式定期运行,并产生最新的系统评估指标,并与竞争对手的系统进行比较.
- 用c#和 .NET framework. 创建新的API端点并优化现有的API端点, 从而显著降低响应延迟.
- 将带有遗留代码的大型系统组件重构为遵循最佳实践设计模式的可扩展设计, 因此,在保持向后兼容性的同时,允许更容易的未来可扩展性.
Data Scientist
Self-employed
- 与化学专家合作完成化学数据分析任务, 侧重于发现与特定疾病相关的药物中化合物结构及其用途之间的模式和关系.
- 在自然语言理解方面进行实验,并创建了一个执行意图分类和命名实体识别的管道,以自动处理客户收据.
- 采用图像识别和计算机视觉算法,增强了非标车牌识别系统的识别能力, hand-written, 以及多语言角色.
Research Intern
Ulm University
- 进行神经信息学方面的研究, 专注于分析患者的生物医学数据,并识别反映患者在医疗手术期间所经历的疼痛程度的模式.
- 创建机器学习模型,根据面部表情的视觉数据和神经系统传感器记录信号的生物电位数据,预测特定患者的疼痛强度.
- 用R语言开发了一个神经网络包,实现了参数化, 采用弹性和经典反向传播算法优化多层感知.
Experience
用于标注语义分割像素的深度学习助手
工作同事匹配的词嵌入
自动化数据处理和可视化管道
提高图像质量的生成对抗网络
基于图cnn和gan的交通场景生成
律师人工智能助理
投资备忘录创建AI助手
用于自动客户服务聊天评估的AI法官
Skills
Languages
Python, SQL, C#, R, Java, C++, JavaScript, SPARQL, RDF, XPath, XQuery, Regex, 谷歌应用程序脚本, TypeScript
Libraries/APIs
Pandas, Scikit-learn, NumPy, SciPy, PyTorch,自然语言工具包(NLTK), HDF5, TensorFlow, Node.js, Matplotlib, OpenCV, Ggplot2, Spark ML, SQLAlchemy, NetworkX, Tidyverse, Google表单API, 谷歌语音API, 谷歌语音转文本API, React, Office API, LINQ, D3.js
Paradigms
数据科学,敏捷软件开发,MapReduce, ETL
Platforms
Jupyter Notebook, Visual Studio Code (VS Code), 亚马逊网络服务(AWS), Linux, Anaconda, Docker, RStudio, 谷歌云平台(GCP), Azure
Storage
PostgreSQL, Cassandra, Elasticsearch, MySQL, Data Pipelines, JSON, Redis, Redshift
Other
Neural Networks, 数据可视化, 自然语言处理(NLP), 机器学习, 人工智能(AI), Data Analysis, Data Scraping, Data Analytics, Analysis, Analytics, ChatGPT, GPT, OpenAI GPT-4 API, LangChain, OpenAI GPT-3 API, Transformers, Computer Vision, Active Learning, Deep Learning, 工程数据, BERT, A/B Testing, Cohort Analysis, Metabase, Language Models, 自然语言理解(NLU), 语义分割, 软件工程, Cheminformatics, Word2Vec, GloVe, 卷积神经网络, 循环神经网络(RNN), Neuroinformatics, 深度神经网络, Data Modeling, Web Development, 线性回归, Linear Algebra, Time Series, 时间序列分析, 社会网络分析, 网络分析, Mathematics, Statistics, Data Processing, Bonobo, 逆向工程, Big Data, Scraping, 文本分类, Classification, 探索性数据分析, 文本分类, Categorization, 科学数据分析, Clustering, FAISS, 社交网络分析, 图像处理, 数据构建工具(dbt), Funnel Analysis, 假设检验, 生成对抗网络(GANs), Image Analysis, Shell Scripting, Web Scraping, 统计数据分析, Hugging Face, 机器学习操作(MLOps), 谷歌云功能, 预测分析, Data Mining, ETL Tools, ETL Testing, Text Mining, 自动驾驶汽车, Code Review, 技术招聘, Interviewing, 推荐系统, Excel 365, 实验设计, OfficeJS, Office Add-ins, 数据库分析, 人工神经网络(ANN), Search, 生成预训练变压器(GPT), GPT-Neo, HTML Parsing, Text Generation, OCR, 文字识别, 大型语言模型(llm), CSV, 数据转换, Word Embedding, Back-end, Dashboards, Gunicorn, Chatbots, Full-stack, 软件架构, Streamlit, APIs, Cloud, Text to Task
Tools
Celery, 命名实体识别(NER), Seaborn, Git, Visual Studio, Grafana, GitLab, Docker Hub, GitHub, Spark SQL, Kibana, Apache Airflow, Amazon SageMaker, Elastic, Dplyr, Google Sheets, Pytest, Babel, Yeoman, Doc2Vec, Jupyter
Frameworks
ASP.NET, Flask, .. NET, Spark, Apache Spark, RStudio Shiny, Django, Jinja
Education
数据科学硕士学位
慕尼黑工业大学(TUM) -德国
计算机科学(荣誉)学士学位
开罗的德国大学——埃及新开罗