开发一个聊天app需要多少钱聊天软件找谁好?用什么语言最快?

中的WEB服务,就是基于SOAP。

简单对象访问协议(SOAP)是W3C组织的一个Note, 它描述了一种在分散的或分布式的环境中如何交换信息的轻量级协议。SOAP是一个基于XML的协议,它包括三个部分:SOAP封装(Envelop),封装定义了一个描述消息中的内容是什么,是谁发送的,谁应当接受并处理它以及如何处理它们的框架;SOAP编码规则(Encoding Rules),用于表示应用程序需要使用的数据类型的实例;SOAP RPC表示(RPC Representation),表示远程过程调用和应答的协定;SOAP可以和多种传输协议绑定(Binding),使用底层协议交换信息。在这个文档中,目前只定义了SOAP如何和HTTP以及HTTP扩展进行绑定的框架。

SERVICE可以相互对应,可以使用WSDL作为这种通信方式的描述文件,利用WSDL工具可以自动生成WS和用户端的框架文件,SOAP具备把复杂对象序列化捆绑到XML里去的能力。

SOAP的前身是RPC, 就是远程呼叫处理的协议,这个协议安全性不是很好,多数防火墙都会阻挡RPC的通信包,而SOAP则使用HTTP协议作为基本的协议,使用端口80使得SOAP可以透过防火墙,完成RPC的功能。

SOAP协议和HTTP协议一样,都是底层的通信协议,只是请求包的格式不同而已,SOAP包是XML格式的,现在我们编写WEB SERVICE不需要深入理解SOAP也没关系。如果SERVICE和CLIENT在同样的环境下使用SOAP,由于一般情况下都有自动生成SOAP程序框架的工具,因此不知道细节也没关系. 可是,

在URL前加https://前缀表明是用SSL加密的。你的电脑与服务器之间收发的信息传输将更加安全。 Web服务器启用SSL需要获得一个服务器证书并将该证书与要使用SSL的服务器绑定。 http和https使用的是完全不同的连接方式,用的端口也不一样,前者是80,后者是443。
HTTPS协议是由SSL+HTTP协议构建的可进行加密传输、身份认证的网络协议

它是一个安全通信通道,它基于HTTP开发,用于在客户计算机和服务器之间交换信息。它使用安全套接字层(SSL)进行信息交换,简单来说它是HTTP的安全版。
它是由Netscape开发并内置于其浏览器中,用于对数据进行压缩和解压操作,并返回网络上传送回的结果。HTTPS实际上应用了Netscape的安全全套接字层(SSL)作为HTTP应用层的子层。(HTTPS使用端口443,而不是象HTTP那样使用端口80来和TCP/IP进行通信。)SSL使用40 位关键字作为RC4流加密算法,这对于商业信息的加密是合适的。HTTPS和SSL支持使用X.509数字认证,如果需要的话用户可以确认发送者是谁。
https协议需要到ca申请证书,一般免费证书很少,需要交费。
http是超文本传输协议,信息是明文传输,https 则是具有安全性的ssl加密传输协议
http和https使用的是完全不同的连接方式用的端口也不一样,前者是80,后者是443。
http的连接很简单,是无状态的
HTTPS协议是由SSL+HTTP协议构建的可进行加密传输、身份认证的网络协议 要比http协议安全
1 . 信任主机的问题. 采用https 的server 必须从CA 申请一个用于证明服务器用途类型的证书. 改证书只有用于对应的server 的时候,客户度才信任次主机. 所以目前所有的银行系统网站,关键部分应用都是https 的. 客户通过信任该证书,从而信任了该主机. 其实这样做效率很低,但是银行更侧重安全. 这一点对我们没有任何意义,我们的server ,采用的证书不管自己issue 还是从公众的地方issue, 客户端都是自己人,所以我们也就肯定信任该server.
2 . 通讯过程中的数据的泄密和被窜改

    a) 主要目的是保证server 就是他声称的server. 这个跟第一点一样.
    b) 服务端和客户端之间的所有通讯,都是加密的.
    i. 具体讲,是客户端产生一个对称的密钥,通过server 的证书来交换密钥. 一般意义上的握手过程.
    ii. 加下来所有的信息往来就都是加密的. 第三方即使截获,也没有任何意义.因为他没有密钥. 当然窜改也就没有什么意义了.
  1. 少许对客户端有要求的情况下,会要求客户端也必须有一个证书.
    a) 这里客户端证书,其实就类似表示个人信息的时候,除了用户名/密码, 还有一个CA 认证过的身份. 应为个人证书一般来说上别人无法模拟的,所有这样能够更深的确认自己的身份.
    b) 目前少数个人银行的专业版是这种做法,具体证书可能是拿U盘作为一个备份的载体.
    a) 本来简单的http协议,一个get一个response. 由于https 要还密钥和确认加密算法的需要.单握手就需要6/7 个往返.
    b) 接下来才是具体的http协议,每一次响应或者请求, 都要求客户端和服务端对会话的内容做加密/解密.
    i. 尽管对称加密/解密效率比较高,可是仍然要消耗过多的CPU,为此有专门的SSL 芯片. 如果CPU 信能比较低的话,肯定会降低性能,从而不能serve 更多的请求.
    ii. 加密后数据量的影响. 所以,才会出现那么多的安全认证提示

可以将每一条数据先加载到list集合中,然后通过适配器将每一条数据加载到listview中实现listview对数据的逐行显示。

9.安卓系统的理解,优缺点
Android一词的本义指“机器人”,同时也是Google于2007年11月5日 宣布的基于Linux平台的开源手机操作系统的名称,该平台由操作系统、中间件
、用户界面和应用软件组成。

Android分为四个层,从高层到低层分别是应用程序层、应用程序框架层、系统运行库层和Linux内核层。

优点:开放性,挣脱束缚,丰富硬件,Google应用
缺点:版本过多,升级过快
SIM卡里的所有文件按树来组织:
1>主文件MF(Master File)——每一块SIM卡只有一个唯一的主文件, 其他所有文件都是它的子孙, 主文件只有文件头,里面存放着整个SIM卡的控制和管理信息
2>专用文件DF(Dedicated File)——也是只有一个文件头, 里面存放着整个目录的管理控制信息, 专用文件相当于一个目录的根.
3>基本文件EF(Elementary File)——既有文件头,也有文件体, 文件头存放该文件的位置和控制信息, 文件体存放真正的数据, 整个SIM卡中只有基本文件有文件体, 也只有基本文件才用来存放数据.

11.四大组件哪些能动态注册

14.内存泄露遇见过哪些问题,解决办法,回收的算法
问题:运行两次后的输出结果,程序退出了,后台仍然有两个线程在跑,无法被释放,如果是大程序,就会导致:一、耗电;二、内存泄露。
在程序销毁的时候,要通过Handler的removeCallbacks(Runnable r)方法来手动释放掉该线程,当然要把Runnable单独提出来写。使用完后,程序必须负责相应的调用free或delete释放该内存块,否则,这块内存就不能被再次使用,我们就说这块内存泄漏了。??

15.接口和抽象类的区别?
abstract可以修饰抽象方法,而一个类只要有一个抽象方法,就必须用abstract定义该类,即抽象类。
用interface修饰的类,里面的方法都是抽象方法,因此在定义接口的时候,可以直接不加那些修饰,系统会默认的添上去。接口里面的字段都是公有常量,即public static final修饰的字段。

JavaFX的需求,并且提供更多能有效增强网络应用的标准集。

18.自定义一个不带系统边框的Dialog?
首先定义样式文件style.xml,边框设计windowframe属性为@null,将背景设置为自己想要的背景,将自定义dialog继承Dialog,将布局文件载入,创建dialog,并将自己设置的样式文件加载进去,最终实现自定义的Dialog.

20.图片的异步加载的方法?
1.利用软引用来缓存图片Bitmap,用图片的URL作为缓存查找的Key;
3.如果两级缓存都没取到图片,则从服务器获取,并加入缓存;
4.加载完后通过回调接口通知UI更新;

21.瀑布流实现方式?
a.自定义scrollView,并且使用监听器模式,对其滚动到最顶部、及最底部进行监听操作。
d.根据监听器对其滚动到顶部(不做操作)、滚到最底部(加载更多数据)、正在滚动进行操作(滚动超过两屏,回收两屏之前图片回收及回滚到之前屏幕图片重载)。

22.把一张特别大的图片,分成几十张小的图片,在最短的时间内给处理?
DVM指dalivk的虚拟机。每一个Android应用程序都在它自己的进程中运行,都拥有一个独立的Dalvik虚拟机实例。而每一个DVM进程都是在Linux系统中的一个进程,所以可以认为是同一个概念。
1:Dalvik主要是完成对象生命周期管理,堆栈管理,线程管理,安全和异常管理,以及垃圾回收等等重要功能。
2:Dalvik负责进程隔离和线程管理,每一个Android应用在底层都会对应一个独立的Dalvik虚拟机实例,其代码在虚拟机的解释下得以执行。
3:不同于Java虚拟机运行java字节码,Dalvik虚拟机运行的是其专有的文件格式Dex 4:dex文件格式可以减少整体文件尺寸,提高I/o操作的类查找速度。
5:odex是为了在运行过程中进一步提高性能,对dex文件的进一步优化。
6:所有的Android应用的线程都对应一个Linux线程,虚拟机因而可以更多的依赖操作系统的线程调度和管理机制
7:有一个特殊的虚拟机进程Zygote,他是虚拟机实例的孵化器。它在系统启动的时候就会产生,它会完成虚拟机的初始化,库的加载,预制类库和初始化的操作。如果系统需要一个新的虚拟机实例,它会迅速复制自身,以最快的数据提供给系统。对于一些只读的系统库,所有虚拟机实例都和Zygote共享一块内存区域。
24.嵌入式操作系统内存管理有哪几种,各有何特性 ?
1、虚拟内存管理机制: 有一些嵌入式处理器提供了MMU,在MMU具备内存地址映射和寻址功能,它使操作系统的内存管理更加方便。如果存在MMU ,操作系统会使用它完成从虚拟地址到物理地址的转换, 所有的应用程序只需要使用虚拟地址寻址数据。 这种使用虚拟地址寻址整个系统的主存和辅存的方式在现代操作系统中被称为虚拟内存。MMU 便是实现虚拟内存的必要条件。 虚拟内存的管理方法使系统既可以运行体积比物理内存还要大的应用程序,也可以实现“按需调页”策略,既满足了程序的运行速度,又节约了物理内存空间。 在L inux系统中,虚拟内存机制的实现实现为我们提供了一个典型的例子:在不同的体系结构下, 使用了三级或者两级页式管理,利用MMU 完成从虚拟地址到物理地址之间的转换。基于虚拟内存管理的内存最大好处是:由于不同进程有自己单独的进程空间,十分有效的提高了系统可靠性和安全性。 2、非虚拟内存管理机制: 在实时性要求比较高的情况下,很多嵌入式系统并不需要虚拟内存机制:因为虚拟内存机制会导致不确定性的 I/O阻塞时间, 使得程序运行时间不可预期,这是实时嵌入式系统的致命缺陷;另外,从嵌入式处理器的成本考虑,大多采用不装配MMU 的嵌入式微处理器。所以大多嵌入式系统采用的是实存储器管理策略。因而对于内存的访问是直接的,它对地址的访问不需要经过MMU,而是直接送到地址线上输出,所有程序中访问的地址都是实际的物理地址;而且,大多数嵌入式操作系统对内存空间没有保护,各个进程实际上共享一个运行空间。一个进程在执行前,系统必须为它分配足够的连续地址空间,然后全部载入主存储器的连续空间。

25.什么是嵌入式实时操作系统, Android 操作系统属于实时操作系统吗?
嵌入式实时操作系统是指当外界事件或数据产生时,能够接受并以足够快的速度予以处理,其处理的结果又能在规定的时间之内来控制生产过程或对处理系统作出快速响应,并控制所有实时任务协调一致运行的嵌入式操作系统。
嵌入式操作系统主要用于工业控制、军事设备、航空航天等领域对系统的响应时间有苛刻的要求,这就需要使用实时系统。又可分为软实时和硬实时两种,而 android 是基于 linux 内核的,因此属于软实时。
26.一条最长的短信息约占多少byte?
一条最长的短信息约占140byte

27.android中的动画有哪几类,它们的特点和区别是什么?
答:Android中动画可以分为两大类:帧动画、补间动画
1)补间动画:(你定义一个开始和结束,中间的部分由程序运算得到。就是对场景里的对象不断的进行图像变化来产生动画效果(旋转、平移、放缩和渐变))AlphaAnimation(渐变型动画)、scaleAnimation(缩放型动画)、 TranslateAnimation(平移型动画)、 RotateAnimation(旋转型动画)、
2)逐帧动画:Frame(把一连串的图片进行系列化连续播放,如同放电影的效果),它是通过播放一张一张图片来达到动画的效果;
其中Message类就是定义了一个信息,这个信息中包含一个描述符和任意的数据对象,这个信息被用来传递给Handler.Message对象提供额外的两个int域和一个Object域。
默认情况下一个线程是不存在消息循环(message 模型(model)对象:是应用程序的主体部分,所有的业务逻辑都应该写在该层。
视图(view)对象:是应用程序中负责生成用户界面的部分。也是在整个mvc架构中用户唯一可以看到的一层,接收用户的输入,显示处理结果。
控制器(control)对象:是根据用户的输入,控制用户界面数据显示及更新model对象状态的部分,控制器更重要的一种导航功能,响应用户出发的相关事件,交给m层处理。
android鼓励弱耦合和组件的重用,在android中mvc的具体体现如下:
1)视图层(view):一般采用xml文件进行界面的描述,使用的时候可以非常方便的引入,当然,如果你对android了解的比较的多了话,就一定可以想到在android中也可以使用javascript+html等的方式作为view层,当然这里需要进行java和javascript之间的通信,幸运的是,android提供了它们之间非常方便的通信实现。
2)控制层(controller):android的控制层的重任通常落在了众多的acitvity的肩上,这句话也就暗含了不要在acitivity中写代码,要通过activity交割model业务逻辑层处理,这样做的另外一个原因是android中的acitivity的响应时间是5s,如果耗时的操作放在这里,程序就很容易被回收掉。
3)模型层(model):对数据库的操作、对网络等的操作都应该在model里面处理,当然对业务计算等操作也是必须放在的该层的。

除了在栈顶的Activity,其他的Activity都有可能在内存不足的时候被系统回收,一个Activity越处于栈底,被回收的可能性就越大。如果我们没有覆写onSaveInstanceState()方法,此方法的默认实现会自动保存Activity中的某些状态数据,比如Activity中各种UI空间的状态。Android应用框架中定义的几乎所有的UI控件都恰当的实现了onSaveInstanceState()方法,因此当Activity被摧毁和重建时,这些UI控件会自动保存和恢复状态数据。比如EditText控件会自动保存和恢复输入的数据,而CheckBox控件会自动保存和恢复选中状态。开发者只需要为这些控件指定一个唯一的ID(通过设置android:id属性即可),剩余的事情就可以自动完成了。如果没有为控件指定ID,则这个控件就不会进行自动的数据保存和恢复操作。
从而减少了很多不必要的View的创建
3)、当ListView加载数据量较大时可以采用分页加载和图片异步加载

应用场景:音频,拍摄车牌号
37.链表和数组的区别?
数组是将元素在内存中连续存放,由于每个元素占用内存相同,可以通过下标迅速访问数组中任何元素。但是如果要在数组中增加一个元素,需要移动大量元素,在内存中空出一个元素的空间,然后将要增加的元素放在其中。同样的道理,如果想删除一个元素,同样需要移动大量元素去填掉被移动的元素。如果应用需要快速访问数据,很少或不插入和删除元素,就应该用数组。
链表恰好相反,链表中的元素在内存中不是顺序存储的,而是通过存在元素中的指针联系到一起。比如:上一个元素有个指针指到下一个元素,以此类推,直到最后一个元素。如果要访问链表中一个元素,需要从第一个元素开始,一直找到需要的元素位置。但是增加和删除一个元素对于链表数据结构就非常简单了,只要修改元素中的指针就可以了。如果应用需要经常插入和删除元素你就需要用链表数据结构了。
二者都属于一种数据结构
(1) 从逻辑结构角度来看
a, 数组必须事先定义固定的长度(元素个数),不能适应数据动态地增减的情况。当数据增加时,可能超出原先定义的元素个数;当数据减少时,造成内存浪费。
b,链表动态地进行存储分配,可以适应数据动态地增减的情况,且可以方便地插入、删除数据项。(数组中插入、删除数据项时,需要移动其它数据项)
(2)从内存存储角度来看
a,(静态)数组从栈中分配空间, 对于程序员方便快速,但自由度小。
b, 链表从堆中分配空间, 自由度大但申请管理比较麻烦.
散列表(Hash table,也叫哈希表),是根据关键码值(Key value)而直接进行访问的数据结构。也就是说,它通过把关键码值映射到表中一个位置来访问记录,以加快查找的速度。这个映射函数叫做散列函数,存放记录的数组叫做散列表。
给定表M,存在函数f(key),对任意给定的关键字值key,代入函数后若能得到包含该关键字的记录在表中的地址,则称表M为哈希(Hash)表,函数f(key)为哈希(Hash) 函数
作用:HASH表主要就是提供更快的查找速度,简单来说就是分桶。
比如说你们学校的一个年级有很多班是吧? 那么现在要查找一位同学。如果不看班级直接找,就需要每个班级一个一个的查找是不? 那现在因为分了班级,我们有一个函数可以通过名字产生它的班级号。比如说王勇,二班。 那么现在我们直接hash( 王勇) = 2; 然后我们就直接从2班开始找。 如果2班有50个学生,那么我们最多查找50次对吗? 好。假设你们年级一共有10个班,如果没有这个hash函数,那么直接找,最坏可能要查找50*10=500次。!! 这个班级其实就是每个桶!! 这就是分桶。。。通过哈希函数产生哈希值,然后相同哈希值的元素放在相同的桶里边。。。!
这样可以通过hash这个间接作用减少查找的时间和次数!这就是它的意义!!
40.什么是锁?有什么用?有哪些锁?为什么需要锁?
锁是为了保证安全性,如程序运行时保证另外的程序不能再对本程序所使用到的数据进行某些操作,版本软件的“不能合并”文件不能同时被两人修改等。
锁分为:线程锁,数据库锁,SVN锁等等
1、当几个线程都用到了某个量,但是这个量却能影响程序的运行时就需要线程锁来控制一次只能由一个线程访问这个量。如果没有使用线程锁会出现争用情况。
两个或更多的线程或进程读或写一些共享数据,而最终结果取决于这些线程是如何被调度计时的。争用情况可能会导致不可预见的结果和隐蔽的程序错误。
2、数据库锁的作用是防止程序运行的时候其他的程序不能再对该程序所使用到的数据进行操作,保护数据的安全性。
3、SVN锁的作用是防止版本软件中的“不能合并”的文件(如:图形文件)不能被多人同时更改的时候进行锁定,当一个人对其进行操作时,其他人不能对这个文件再进行操作,保证了文件的安全性。
答: Android中界面部分也采用了当前比较流行的MVC框架。

  1. 视图层(View):一般采用XML文件进行界面的描述,使用的时候可以非常方
    件加载,同时可以实现Java和JavaScript之间的通信。交割Model业务逻辑层处理,这样做的另外一个原因是Android中的Acitivity的响
    应时间是5s,如果耗时的操作放在这里,Android的控制层的重任通常落在了众多
    的Acitvity的肩上,程序就很容易被回收掉。
    3)模型层(Model):对数据库的操作、对网络等的操作都应该在Model里面处理,
    当然对业务计算等操作也是必须放在的该层的。
    在Android SDK中的数据绑定,也都是采用了与MVC框架类似的方法来显示数据。在控制层上将数据按照视图模型的要求(也就是Android

即像素,1px代表屏幕上一个物理的像素点;
px单位不被建议使用,因为同样100px的图片,在不同手机上显示的实际大小可能不同
Pixel)。sp和dp很类似但唯一的区别是,Android系统允许用户自定义文字尺寸大小(小、正常、大、超大等等),当文字尺寸是“正常”时1sp=1dp=0.00625英寸,而当文字尺寸是“大”或“超大”时,1sp>1dp=0.00625英寸。类似我们在windows里调整字体尺寸以后的效果——窗口大小不变,只有文字大小改变。
答:1)应用程序层 java语言 应用程序开发

答:最常用的布局有以下这几种:
第一种:帧布局(框架布局)FrameLayout,在这个布局中,所有的子元素统统放于这块区域的左上角,并且后面的子元素直接覆盖在前面的子元素之上,将前面的子元素部分和全部遮挡。
第二种:线性布局LinearLayout,最常用的一种布局方式,所有子控件的对齐方式,取决于如何定义 orientation的属性:vertical 垂直方向 ,如果按照这种方向所有的子控件将按照垂直的方式分布在布局上,每行只允许有一个子元素,horizontal水平方向 ,这时子控件将会以水平的方向分布在布局中。
第三种:绝对布局AbsoluteLayout,又可以叫做坐标布局,可以直接指定子元素的绝对位置,这种布局简单直接,直观性强,但是由于手机屏幕尺寸差别比较大,使用绝对定位的适应性会比较差。
第四种:相对布局RelativeLayout,允许子元素指定它们相对于其父元素或兄弟元素的位置,这是实际布局中最常用的布局方式之一。它灵活性大很多,当然属性也多,操作难度也大,属性之间产生冲突的的可能性也大,使用相对布局时要多做些测试。
第五种:表格布局TableLayout,表格布局TableLayout以行列的形式管理子元素,每一行是一个TableRow布局对象,当然也可以是普通的View对象,TableRow里每放一个元素就是一列,总列数由列数最多的那一行决定。
第六种:网格布局 GridLayout,在Android 4.0中,新引入的GridLayout网格布局,GridLayout布局使用虚细线将布局划分为行,列和单元格,也支持一个控件在行,列上都有交错排列。而GridLayout使用的其实是跟LinearLayout类似的API,只不过是修改了一下相关的标签而已,所以对于开发者来说,掌握GridLayout还是很容易的事情。

(Android 4.0的SDK已经发布,在众多的新增特性中,其中对开发者来说比较重要的特性之一,是新增的两种界面布局方式:Space和Gridlayout)

  • 今年光棍节的那天,一个人在寝室睡到傍晚才起床。我的寝室在拐弯处,小婷子来我寝室串门,我俩聊的正嗨时,一个身影在门口...

  • 圆圆是大学毕业一起进公司的女孩。 进公司没几天,她被分配去了广州,我留在了公司总部。 半年过后,我去广州出差支援。...

  • 01 读大学的时候,我们宿舍有四个人,包括我。 我第一个见到的是小猫,她很热情地跟我打招呼,还给了我一点家乡特产。...

  • 何谓蚂蚁?生活中的琐事。何谓大象?心中的理想。 最近发生在身边的两件事。第一,回家的困扰,回家让自己压抑。因为总感...

  • 在外工作的我最害怕的就是接到家里来的电话,因为家里有病重的老妈妈…… 然而今天下午却接到了,慌了,乱了……

一定一定要掌握python,其中的一些库 nltk,spacy,尤其是spacy他的速度要远好于我之前用的所有工具。包括迈入deep learning之后的pytorch等等库,都是依赖python的,所以学习python是必不可少的。

推荐《数学之美》,这个书写得特别科普且生动形象,我相信你不会觉得枯燥。这个我极力推荐,我相信科研的真正原因是因为兴趣,而不是因为功利的一些东西。

接下来说,《统计自然语言处理基础》这本书,这书实在是太老了,但是也很经典,看不看随意了。

现在自然语言处理都要靠统计学知识,所以我十分十分推荐《统计学习方法》,李航的。李航老师用自己课余时间7年写的,而且有博士生Review的。自然语言处理和机器学习不同,机器学习依靠的更多是严谨的数学知识以及推倒,去创造一个又一个机器学习算法。而自然语言处理是把那些机器学习大牛们创造出来的东西当Tool使用。所以入门也只是需要涉猎而已,把每个模型原理看看,不一定细致到推倒。

宗成庆老师 的统计自然语言处理第二版非常好~ 蓝色皮的~~~

然后就是Stanford公开课了,Stanford公开课要求一定的英语水平。 我觉得讲的比大量的中国老师好~

如果做工程前先搜索有没有已经做好的工具,不要自己从头来。做学术前也要好好的Survey!

希望可以掌握以下的几个tool:

还记得小时候看过的数码宝贝,每个萌萌哒的数码宝贝都会因为主人身上发生的一些事情而获得进化能力,其实在自然语言处理领域我觉得一切也是这样~ 我简单的按照自己的见解总结了每个阶段的特征,以及提高的解决方案

1.幼年体——自然语言处理好屌,我什么都不会但是好想提高

建议。。。去看公开课~去做Kaggle的那个情感分析题。

2.成长期——觉得简单模型太Naive,高大上的才是最好的

这个阶段需要自己动手实现一些高级算法,或者说常用算法,比如LDA,比如SVM,比如逻辑斯蒂回归。并且拥抱Kaggle,知道trick在这个领域的重要性。在预训练模型和Transformer模型有了以后,一定要精通这两个模型,精通到什么程度呢,Bert Base的参数量是怎么得到的要能脱口而出。

3.成熟期——高大上的都不work,通过特征工程加规则才work

大部分人应该都在这个级别吧,包括我自己,我总是想进化,但积累还是不够。觉得高大上的模型都是一些人为了paper写的,真正的土方法才是重剑无锋,大巧不工。在这个阶段,应该就是不断读论文,不断看各种模型变种吧,什么句子相似度计算word2vec cosine已经不再适合你了。

4.完全体——在公开数据集上,把某个高大上的模型做work了~

这类应该只有少数博士可以做到吧,我已经不知道到了这个水平再怎么提高了~是不是只能说不忘初心,方得始终。

好好锻炼身体,保持更长久的究极体形态

希望可以理解自然语言处理的基本架构~:分词=>词性标注=>Parser

Quora上推荐的NLP的论文(摘自Quora 我过一阵会翻译括号里面的解释):

Parsing(句法结构分析~语言学知识多,会比较枯燥)

Machine Translation(机器翻译,如果不做机器翻译就可以跳过了,不过翻译模型在其他领域也有应用)

其实我相信,大家更感兴趣的是上层的一些应用~而不是如何实现分词,如何实现命名实体识别等等。而且应该大家更对信息检索感兴趣。不过自然语言处理和信息检索还是有所区别的,So~~~我就不在这边写啦


第一讲 实验心理学的概述

1.1 实验心理学的产生与发展随堂测验

1.2 心理学实验研究的伦理随堂测验

1、开展以动物为研究的被试时,下列表述不正确的是( )
    C、获取、照料、使用和处理动物应符合国家的相关法律和专业标准

1.3 心理学实验研究的一般程序随堂测验

第二讲 心理学实验的变量与设计

2.1 心理学实验的含义与基本形式随堂测验

3、德国心理学家艾宾浩斯(H.Ebbinghaus)用无意义音节作记忆材料,用节省法计算保持和遗忘的数量。并根据他的实验结果绘成描述遗忘进程的曲线,即著名的艾宾浩斯记忆遗忘曲线。 该研究属于函数型实验研究。

2.2 心理学实验与理论随堂测验

1、对遗忘症患者发现,相比正常人,患者的外显记忆显著低于正常人,而内隐记忆则无显著差别。上述研究采用了实验性分离技术。

2.3 自变量及其控制随堂测验

2.4 因变量及其控制随堂测验

1、实验研究的外在效度是指( )
    D、实验变量在实验时的操作定义与推论时的定义的一致性程度

3、(2019)有研究表明,在温度很高(34℃以上)的房间里填写问卷的学生,比在温度正常的房间里填写问卷的学生,对陌生人更怀有敌意。在这个研究中,温度与学生反应分别是( )

2.5 额外变量及其控制随堂测验

2.6 实验设计的分类及其评价标准随堂测验

2.7 非实验设计随堂测验

5、某研究比较一个班学生在增加心理课前后一个月的学习成绩,发现差异不显著。该研究设计属于非实验设计。

2.8 准实验设计随堂测验

2.10 真实验设计:多因素实验设计(一)随堂测验

2、材料:实验设计,自变量有靶子词和非靶子词,另一个自变量是高分辨和低分辩。将60名被试分两组,一组参与靶子词-高分辨和靶子词-低分辨的实验,另一组参与非靶子词和非靶子词-低分辨的实验。实验存在的交互作用是( )

2.11 真实验设计:多因素实验设计(二)随堂测验

1、材料:实验设计,自变量有靶子词和非靶子词,另一个自变量是高分辨和低分辩。将60名被试分两组,一组参与靶子词-高分辨和靶子词-低分辨的实验,另一组参与非靶子词和非靶子词-低分辨的实验。该实验是( )

2.12 真实验设计:多因素实验设计(三)随堂测验

2.13 真实验设计:多因素实验设计(四)随堂测验

3.1 反应时的含义与种类随堂测验

3.2 影响反应时的因素随堂测验

4、在反应时实验中,为防止被试提前反应,可采取的措施有( )

3.3 减法反应时技术随堂测验

3.4 加法反应时技术随堂测验

3.5 开窗技术随堂测验

3.6 内隐联想测验随堂测验

2、外在情感性西蒙任务与内隐联想测验最大的不同在于:内隐联想测验效应的计算依赖于两个联合任务反应时均数之差,而外在情感性西蒙任务则是要比较被试在同一任务的不同实验条件下的行为差异。

4.1 绪论及阈限的测量随堂测验

4、测定阈限的平均差误法相比于极限法,优点在于( )
    B、没有标准刺激和比较刺激在时间上先后呈现造成的时间误差
    C、由于被试自己动手参与,由于疲劳造成的误差没有那么明显

4.2 心理量表法随堂测验

4、制作心理物理量表的差别阈限法是指( )
    A、把一个感觉量加倍或者减半获取其他比例来建立的心理量表
    C、把两个刺激所引起的某感觉的连续体分出主观上相等的距离
    D、以主试给出的一个标准刺激的主观数值为参照,把其它同类但强度不同的主观值放在与这个标准刺激的主观值关系中进行判断,并给出一个数字

4.3 信号检测论由来与基本原理随堂测验

3、军事上需要高水平的雷达操作员,理想的雷达操作员应该始终保持对显示屏的注意。可是,实际情况常常是,操作员的警戒能力总是随工作时间的延续而下降。以下对警戒下降的原因分析不正确的是( )
    C、警戒下降可能是由感觉敏感性和反应标准的双重变化而引起

4.4 信号检测论的实验方法随堂测验

5.1 声音的心理特性随堂测验

5.2 声音的掩蔽随堂测验

2、一个声音的听觉阈值因另一个声音的出现而提高的现象称为听觉遮蔽,其特点有( )

5.3 听觉疲劳与适应随堂测验

1、不管是听觉适应还是听觉疲劳都会造成听系统感受性下降。

5.4 声音的空间定位实验随堂测验

5.5 语音知觉实验随堂测验

1、汉语的最明显的特点为包括元音在语音音节中占非常大的优势与语音音频的范围比较高。

2、可视化语言就是借助设备可以看出语言特征的语言。

6.1 明适应与暗适应随堂测验

2、暗适应为锥体细胞的暗适应。

6.2 视敏度的测定随堂测验

2、个体明适应时候的视敏度要高于暗适应时候视敏度,主要是因为明适应的视杆细胞的功能增强。

6.3 闪光临界融合频率的测定随堂测验

6.4 视觉的颜色现象实验随堂测验

3、根据补色律,如果A和B混在一起变成黑色,那么A、B就是互补色。

6.5 颜色的知觉现象实验随堂测验

2、颜色对比与颜色适应的神经机制均为受到刺激的神经末梢它会产生疲劳,而刺激颜色的补色就会被我们感知到。

7.1 直接知觉随堂测验

7.2 间接知觉随堂测验

1、以下说法不属于间接知觉论的的是?( )
    B、刺激本身的信息是模糊的,不完整的和不能对外界事物进行全面描述的
    C、个体必须在过去经验的基础上,对刺激信息作出判断、评价和解释,才能实现对刺激的真正知觉

4、所有知觉都是直接和间接一体两面的过程,二者分别属于自上而下的加工和自下而上的加工。

7.3 知觉恒常性实验随堂测验

1、爱波斯坦研究形状恒常性得到的结论是?( )
    D、人从不同角度观看熟悉的物体时能将其知觉为一个恒常的形状

7.4 空间知觉实验随堂测验

7.5 运动知觉实验随堂测验

4、关于运动知觉的说法正确的是( )
    A、运动速度低于运动知觉下阈,我们无法感觉到物体在运动
    C、运动速度介于运动知觉上下阈之间,我们能感受到物体运动
    D、运动速度最核心的决定因素是角速度,所以物体运动的角速度越大,我们知觉到的运动速度越大

5、运动知觉是指对于物体在空间方位的知觉,是多种感觉、器官协同活动的结果。

7.6 无觉察知觉的测定随堂测验

1、Stroop的频率效应是指?( )
    A、一致条件频率增高时,对一致实验的反应时会变快,对不一致实验的反应时会变慢
    B、不一致条件频率增高时,对一致实验的反应时会变快,对不一致实验的反应时会变慢
    C、一致条件频率增高时,对一致实验的反应时会变慢,对不一致实验的反应时会变快
    D、不一致反应频率增高时,对一致实验的反应时会变快,对不一致实验的反应时会也变快

3、Merikle的研究得到哪些结论( )
    A、不一致条件占多数时,无意识知觉到的刺激会引起自动的反应,即典型Stroop效应
    B、有意识知觉到的刺激会引起更为灵活的反应,集中注意条件下被试对不一致的色块命名快于一致的色块命名
    C、一致条件的频率增高的时候,对一致试验的反应时变短,不一致试验的反应时增加

4、Merikle等关于无觉察知觉的研究中,当一致发生的概率远小于不一致发生概率的时候,集中注意条件状态下出现典型的Stroop效应。

5、如果我们没有意识到呈现的启动词,我们的行为将不受影响。

7.7 盲视的实验随堂测验

1、如果让患左侧忽视的病人在左边房子(着火)与右边房子(正常)间做出选择,病人的选择和对此的解释正确的是( )

2、半球忽视的患者对损伤半球同侧空间中性区域的注意缺损

3、切除了视觉功能对应的顶叶皮层脑区患者则不能辨认出任何刺激。

8.1 条件性学习实验随堂测验

8.2 认知性学习实验随堂测验

3、关于托尔曼的认知地图理论,不正确的是( )
    B、认知地图指的是目标对象手段三者联系在一起的认知结构
    C、在认知地图实验中,自变量主要为走迷宫的次数,因变量为通过的时间

5、认知性学习理论将学习归结为刺激-反应的连接。

6、顿悟学习强调奖励的作用

9.1 感觉记忆的实验——部分报告法随堂测验

1、“这是一个关于记亿的实验。实验开始时,计算屏幕中央将相机呈现一系列字母矩阵,呈现的时间很短,您要尽可能地记住它们。当矩阵消失后,将您所看到的字母记录到记录纸上……"。 采用此类指导语的瞬时记忆研究方法是( )

3、(2020)快速向被试呈现三行四列的字母矩阵,在字母消失后,立即随机呈现高、中、低三种不同音高的一个声音信号,分别与字母矩阵中的上、中、下三行对应,要求被试根据不同的音高报告出对应的字母,最后根据正确报告出的字母数来确定信息储存的容量。这种研究记忆的方法属于( )

4、(2020)快速向被试呈现三行四列的字母矩阵,在字母消失后,立即随机呈现高、中、低三种不同音高的一个声音信号,分别与字母矩阵中的上、中、下三行对应,要求被试根据不同的音高报告出对应的字母,最后根据正确报告出的字母数来确定信息储存的容量。该方法研究的心理现象是( )

5、(2020)快速向被试呈现三行四列的字母矩阵,在字母消失后,立即随机呈现高、中、低三种不同音高的一个声音信号,分别与字母矩阵中的上、中、下三行对应,要求被试根据不同的音高报告出对应的字母,最后根据正确报告出的字母数来确定信息储存的容量。该方法确定信息储存容量的计算方法是( )

9.2 短时记忆的实验随堂测验

9.3 长时记忆的实验随堂测验

1、系列位置效应常被看做是支持短时存储不同于长时存储的有效证据,可通过对单词等的自由回忆测验获得。如果改变单词频率、单词呈现速度、单词系列长度,对系列位置效应最有可能造成的影响是( )

9.4 工作记忆的实验随堂测验

9.5 内隐记忆的实验随堂测验

3、用于内隐记忆研究的加工分离程序,其基本假设包括( )

9.6 前瞻记忆的实验随堂测验

9.7 错误记忆的实验随堂测验

9.8 定向遗忘与提取诱发遗忘的实验随堂测验

10.1 情绪的生理指标测量随堂测验

1、以下说法不正确的是( )
    A、生化指标是指在情绪状态时,生化系统、中枢神经介质也会发生一系列变化
    B、神经化学物质的分泌量或排出量可作为情绪研究的客观指标
    C、肾上腺素和去甲肾上腺素的排出量可以作为紧张的客观指标

2、以下关于情绪的生理指标的说明,不正确的是( )
    B、在焦虑状态下,枕叶的α波消失,振幅降低,同时枕叶区、运动区、额叶区的波幅也比正常状态要小
    C、紧张兴奋状态下,肾上腺素含量升高,神经兴奋水平增强
    D、在致痛刺激作用的时候,会出现α波阻断或不完全抑制的现象,并且快波增多,疼痛减轻的时候则恢复回常态

10.2 情绪的主观体验测量随堂测验

10.3 情绪实验的实验方法随堂测验

1、以下说法错误的是( )
    A、条件性情绪技术是一种运用条件反射来研究情绪的技术,可根据条件化的结果推断内部情绪
    B、单词诱导法使用带有情绪色彩的词来诱导积极或消极情绪

3、关于时间抽样技术与法沙弗等人的研究的有关说法,正确的是( )
    A、这种技术的要点是,要被试通过记日记或者问卷的这种方式来记录情绪体验

4、与无关刺激相比,愉快的和不愉快的刺激均能引起皮肤电的反应升高,而愉快刺激引起皮肤电的反应升高更加明显。

5、条件性情绪技术,这是一种运用 来研究情绪的技术,可以根据条件化的结果推断内部的情绪。

11.1 过滤器理论随堂测验

2、下列说法不正确的是( )
    B、Treisman的衰减模型认为注意选择并非全或无的方式,非注意通道的信息只是被减弱了,但如果这些信息对我们很重要,依然可以得到加工
    D、反应选择模型则认为注意选择发生在知觉和反应输出之间

5、减模型认为我们能够接收到情境中的所有信息,只是在进入意识前逐渐衰减。

6、我们在很嘈杂的环境中仍能听到别人在叫自己的名字,这种现象叫做“鸡尾酒会效应”,可以用Broadbent的过滤器模型解释。

11.2 注意资源有限理论和双加工理论随堂测验

3、对下列行为的解释正确的是( )
    A、呈现了绿色P和橙色JK后,被试判断橙色P曾出现,这是出现了错觉性结合
    B、在对experiment这个单词进行记忆后,提及实验能自动拼写出这十个字母,这是一个控制加工转化为自动加工的过程
    C、双侧顶叶受损的病人无法报告红色圆形、绿色方形,是因为无法把不用的特征整合成一个完整的客体知觉
    D、在正立的大象中寻找一个倒立的大象也比在一堆倒立的大象中寻找一个正立的大象要快的多,这可以用特征整合理论解释

4、双加工理论分为两种加工过程:自动化加工和控制性加工,这两种加工过程都有一定的容量限制。

11.3 注意的促进和抑制随堂测验

2、客体优势效应即被试对两个属性来自不同客体的报告正确率显著高于两个属性来自同一客体。

3、返回抑制效应是指被试在无效提示条件下的反应慢于有效条件。

4、返回抑制现象可由注意的动态节律性解释。

11.4 冲突效应随堂测验

3、在Eriksen Flanker任务中,当周围箭头方向和其不一致时,被试的反应快于周围的箭头与其一致的情况。

4、Navon字母任务中,不一致的情况例如小s组成大H。

第十二讲 常用的心理实验技术

12.1 眼动技术随堂测验

2、当前的眼动追踪中最常用的方法是光学追踪法。

12.2 事件相关电位技术随堂测验

12.3 功能性磁共振成像技术随堂测验

我要回帖

更多关于 开发一个聊天app需要多少钱 的文章

 

随机推荐